مدل جدید گوگل نمرات ایمنی پایین‌تر از نسخه قبلی گرفت! – به گزارش میهن تجارت

شماره خبر: 236431
نام خبرنگار: ابوالفضل نورالدین

مدل جدید هوش مصنوعی Google ، Gemini 2.5 Flash ، نسبت به نسخه قبلی خود امتیاز کمتری در تست های ایمنی کسب کرده است.

به گزارش Business News ، مدل جدید هوش مصنوعی Google ، Gemini 2.5 Flash ، عملکرد ضعیف تری نسبت به نسخه قبلی خود یعنی Gemini 2.0 Flash انجام داده است. براساس گزارش های داخلی ، مدل جدید به احتمال زیاد متونی تولید می کند که با سیاست های ایمنی گوگل مغایرت دارد. فلش جمینی 2.5 به ترتیب 4.9 درصد و 4.9 درصد کاهش یافته است.

ایمنی مدل ها چیست؟

ایمنی متن میزان نقض سیاست های Google را بر اساس متنی که به مدل داده می شود ، اندازه گیری می کند. در حالی که ایمنی تصویر متن را ارزیابی می کند که مدل در صورت درخواست از یک تصویر به این سیاست ها پایبند است. هر دو آزمایش به طور خودکار و بدون نظارت انسانی انجام می شود. در بیانیه ای که به ایمیل ارسال شده است ، سخنگوی گوگل تأیید کرد که Flash Gemini 2.5 “عملکرد ضعیفی در ایمنی متن و تصویر دارد.”

تلاش شرکت های اطلاعاتی مصنوعی برای افزایش مجوزها

این نتایج غیر منتظره در حالی منتشر می شود که شرکت های اطلاعاتی مصنوعی در تلاشند تا مدل های خود را مجاز تر کنند ، به عبارت دیگر ، کمتر احتمال دارد که به موضوعات بحث برانگیز یا حساس پاسخ ندهند. برای آخرین مدل های لاما ، متا اعلام کرده است که مدل ها را به گونه ای تنظیم کرده است که “برخی از نظرات را تأیید نکند” و به سؤالات سیاسی “بحث برانگیزتر” پاسخ می دهد. Openai همچنین در اوایل سال جاری اعلام کرد که قصد دارد مدلهای آینده خود را تنظیم کند تا موضع نگیرد و دیدگاههای مختلفی را در مورد موضوعات بحث برانگیز ارائه دهد.

عواقب تلاش برای صدور مجوز

بعضی اوقات ، این تلاش ها برای افزایش مجوز منجر به نتایج معکوس می شود. طبق گفته TechCrunch ، مدل قدرتمند پیش فرض Chatgpt Open -Open به نوجوانان اجازه می دهد تا مکالمات شهوانی تولید کنند. Open EI این رفتار را به یک اشکال نسبت داده است. براساس گزارش فنی Google ، Flash Gemini 2.5 ، که هنوز در مرحله پیش نمایش است ، دستورالعمل های وفادار تر به فلش Gemini 2.0 ، از جمله دستورالعمل هایی که از مرزهای مشکل عبور می کنند ، عمل می کند. این شرکت ادعا می کند که کاهش نمرات را می توان تا حدودی مثبت کاذب نسبت داد ، اما همچنین تصدیق می کند که فلش جمینی 2.5 گاهی اوقات هنگام درخواست صریح “تخلف” ایجاد می کند.

در بخشی از گزارش آمده است: “طبیعتاً بین [دنبال کردن دستورالعمل‌ها] “سیاست های ایمنی استرس و تخلفات وجود دارد که در ارزیابی های ما منعکس می شود.”

به گفته توماس وودساید ، یکی از بنیانگذاران پروژه هوش مصنوعی ایمن ، جزئیات محدودی که Google در گزارش فنی خود ارائه داده است ، شفافیت بیشتری را در آزمایش مدل نشان می دهد. وی به TechCrunch گفت: “بین دستورالعمل های زیر و پیروی از خط مشی ها تعادل وجود دارد ، زیرا برخی از کاربران ممکن است محتوا را درخواست کنند که مغایر با سیاست ها باشد.” “در این حالت ، مدل جدید Google Flash به احتمال زیاد به دستورالعمل ها پایبند است ، در حالی که بیشتر سیاست ها در تضاد هستند.”

Google به دلیل مدل های گزارش ایمنی مورد انتقاد قرار گرفته است. این شرکت چندین هفته طول کشید تا گزارش فنی را برای قدرتمندترین مدل خود یعنی Gemini 2.5 Pro منتشر کند. هنگامی که این گزارش در نهایت منتشر شد ، در ابتدا جزئیات کلیدی آزمون ایمنی را از دست داد. روز دوشنبه ، گوگل گزارش مفصلی را با اطلاعات ایمنی اضافی منتشر کرد.

دیدگاهتان را بنویسید لغو پاسخ

خبرهای امروز:

۱۰ شهید در حملات هوایی اسرائیل به جنوب لبنان

1405-02-24

تریتا پارسی، معاون اندیشکده کوئینسی: آمریکا بر چین فشار خواهد آورد تا به واداشتن ایران برای پذیرش خطوط قرمز هسته‌ای ترامپ کمک کند / تا زمانی که خواسته‌های آمریکا از ایران از دید پکن غیرمنطقی تلقی شود، بعید است این فشارها مؤثر واقع شود / اگر موضع آمریکا تغییر کند و از سوی پکن معقول و سازنده ارزیابی شود، چین ممکن است کمک کند

1405-02-24

مدل جدید گوگل نمرات ایمنی پایین‌تر از نسخه قبلی گرفت! – به گزارش میهن تجارت

ایمنی مدل ها چیست؟

تلاش شرکت های اطلاعاتی مصنوعی برای افزایش مجوزها

عواقب تلاش برای صدور مجوز

دیدگاهتان را بنویسید لغو پاسخ

خبرهای امروز:

۱۰ شهید در حملات هوایی اسرائیل به جنوب لبنان

وصیت‌نامه ترامپ برای ونس!

تصاویر؛ طرح پیراهن تیم‌ملی در جام جهانی ۲۰۲۶ مشخص شد

دیفنس نیوز: ارتش آمریکا اعزام ۴ هزار سرباز به لهستان را لغو کرد

ببینید؛ سرود تیم ملی در جام جهانی 2026 با اجرای پرواز همای + آهنگ و شعر

پیشنهادات سردبیر:

معرفی اختلالات اینترنت به قوه قضاییه

تعویض پراید معرفی شده + عکس

آیا یارانه به مدت دو ماه است؟

فروش این محصولات از یکشنبه 9 ژانویه +جزئیات

صفر -تا -صد دلار سهمیه خرید

هفته گذشته 5 ٪ کاهش قیمت خودرو