وبگردی 18:54 - 10 آذر 1404

باشگاه خبرنگاران

هوش مصنوعی با شعر فریب می‌خورد!

محققان کشف کردند که اگر سوالات ممنوعه (مثل ساخت سلاح یا خودکشی) را به زبان «شعر» از چت‌بات‌ها بپرسید، فیلتر‌های امنیتی آنها از کار می‌افتد.

باشگاه خبرنگاران جوان - محققان می‌گویند می‌توان چت‌بات‌های هوش مصنوعی را با شعر فریب داد تا از موانع امنیتی خود چشم‌پوشی کنند.

یک مطالعه اخیر از آزمایشگاه ایکارو(Icaro) با استفاده از یک ساختار شاعرانه، مدل‌های زبانی بزرگ(LLM) را برای ارائه اطلاعات در مورد موضوعات ممنوعه مانند ساخت بمب هسته‌ای آزمایش کرد و در نهایت معلوم شد که تنها چیزی که برای عبور از موانع امنیتی یک چت‌بات هوش مصنوعی نیاز دارید، کمی خلاقیت است.

به نقل از انگجت، در مطالعه‌ای که توسط آزمایشگاه «ایکارو» با عنوان «شعر خصمانه به عنوان یک مکانیسم فرار از زندان تک‌چرخه‌ای جهانی در مدل‌های زبان بزرگ» منتشر شده است، محققان توانستند با بیان دستور LLMها با شعر، مکانیسم‌های ایمنی مختلف آنها را دور بزنند.

طبق این مطالعه، عبارت‌های شاعرانه به عنوان یک اپراتور فرار از زندان عمومی عمل می‌کند و نتایج نشان می‌دهد که میزان موفقیت کلی در تولید مطالب ممنوعه، از جمله هر چیزی که مربوط به ساخت سلاح‌های هسته‌ای، مطالب مربوط به سوءاستفاده‌های جنسی از کودکان و خودکشی یا خودآزاری، ۶۲ درصد است.

این مطالعه مدل‌های زبانی بزرگ محبوب از جمله مدل‌های ChatGPT شرکت OpenAI، هوش مصنوعی جمینای(Google) گوگل، هوش مصنوعی کلاد(Claude) شرکت آنتروپیک:(Anthropic) و بسیاری دیگر را آزمایش کرد.

محققان میزان موفقیت هر LLM را بررسی کردند، به طوری که مدل‌های جمینای، دیپ‌سیک(DeepSeek) و MistralAI به طور مداوم پاسخ‌هایی ارائه می‌دادند، در حالی که مدل‌های GPT-5 و Claude Haiku 4.5 کمترین احتمال را برای عبور از محدودیت‌های خود داشتند.

محققان می‌گویند شعری که در این مطالعه استفاده شد، برای به اشتراک گذاشتن با عموم بسیار خطرناک است. با این حال، این مطالعه شامل یک نسخه رقیق شده بود تا نشان دهد که دور زدن موانع یک چت‌بات هوش مصنوعی چقدر آسان است.

محققان می‌گویند این کار احتمالاً آسان‌تر از آن چیزی است که ممکن است تصور شود و دقیقاً به همین دلیل است که ما محتاط هستیم.

منبع: ایسنا

لینک منبع

12246610

هتل های مشهد پرشین سفر

www.persiansafar.net

پرس لاین پرسشنامه آنلاین

porsline.ir

عمل استبيان الكتروني بالجوال بواسطة برس لاين

porsline.com

خرید سرور اچ پی

myhpe.shop

دایرکت هوشمند اینستاگرام تگسینو

پربازدید ها

پر بحث ترین ها

مهمترین اخبار وبگردی

وبگردی

تهران در محاصره ۴ جریان بادی؛ کدام باد‌ها «قاتل» و کدام «منجی» هستند؟

«باشگاه خبرنگاران» پایتخت زیر سایه چهار جریان اصلی باد است؛ از نسیم خنک البرز تا باد‌های سمی جنوب و گردوغبار شرق. نقش هر کدام در آلودگی هوای ۱۴۰۴ چه بود؟

وبگردی

مردی که «نیش» طنز را با «نوش» همراه کرد؛ میراث آقای زرویی

«باشگاه خبرنگاران» زرویی نصرآباد معتقد بود طنز باید «نیش» داشته باشد، اما «نوش» هم داشته باشد؛ یعنی تلنگر بزند، اما تحقیر نکند. او طنز را از سرگرمی به یک گفتمان اصلاح‌گر تبدیل کرد.

وبگردی

ثروتمندترین افراد جهان در ۲۰۲۵ کدامند؟

«باشگاه خبرنگاران» نخبگان میلیارد در جهان ثروتمندتر از همیشه شده‌اند؛ دارایی ۱۰ نفر اول لیست فوربس به رقم نجومی ۱.۸۲ تریلیون دلار رسیده است.

وبگردی

هوش مصنوعی با شعر فریب می‌خورد!

«باشگاه خبرنگاران» محققان کشف کردند که اگر سوالات ممنوعه (مثل ساخت سلاح یا خودکشی) را به زبان «شعر» از چت‌بات‌ها بپرسید، فیلتر‌های امنیتی آنها از کار می‌افتد.

وبگردی

ملاقات با «سانسورچی» داخل سرتان؛ مغز چطور خاطرات را گلچین می‌کند؟

«باشگاه خبرنگاران» چرا برخی خاطرات یک عمر می‌مانند و برخی محو می‌شوند؟ کشف جدید نشان می‌دهد بخش «تالاموس» مانند یک ایستگاه بازرسی، خاطرات بی‌ارزش را حذف می‌کند.

وبگردی

این آیات را بخوانید تا با مقام شهید از دنیا بروید

«باشگاه خبرنگاران» با خواندن این سه آیه کوتاه در اول صبح، بیمه شوید. این آیات انسان را از ترس و وابستگی دنیا آزاد کرده و به اوج توکل و آرامش می‌رسانند.

وبگردی

چرا نباید از هوش مصنوعی بترسیم؟

«باشگاه خبرنگاران» نورایی: ما در رودخانه‌ای افتاده‌ایم که باید شنا کردن در آن را یاد بگیریم؛ مقاومت در برابر هوش مصنوعی بی‌فایده است و باید آن را به خدمت گرفت.

وبگردی

آیا جنین در قیامت از مادر شکایت می‌کند؟

«باشگاه خبرنگاران» اگر مادر در مراقبت کوتاهی کرده باشد، فقط در همان حد مقصر است و باید استغفار و جبران کند، اما چون قصد آسیب نداشته، بابت خودِ سقط گناهکار نیست.

وبگردی

هواپیمای ایران را زدند، شاه چیزی نگفت

«باشگاه خبرنگاران» در دوران پهلوی، در حالی که یک مقام عالی از شوروی در ایران اقامت داشته، یک هواپیمای ایرانی در مرز با شوروی، از سوی شوروی مورد هدف قرار می‌گیرد.

وبگردی

از خستگی تا تب ؛ مرز باریک بین آلودگی هوا و آنفلوآنزا

«باشگاه خبرنگاران» با نزدیک شدن فصل‌های سرد و افزایش آلودگی هوا، بسیاری از افراد با علائمی مانند سرفه، گلودرد یا خستگی مواجه می‌شوند و نمی‌دانند علت آن آلودگی هوا یا بیماری‌های فصلی است.