مدل جدید گوگل نمرات ایمنی پایین‌تر از نسخه قبلی گرفت! – به گزارش میهن تجارت

مدل جدید گوگل نمرات ایمنی پایین‌تر از نسخه قبلی گرفت! – تجارت نیوز

مدل جدید هوش مصنوعی Google ، Gemini 2.5 Flash ، نسبت به نسخه قبلی خود امتیاز کمتری در تست های ایمنی کسب کرده است.

به گزارش Business News ، مدل جدید هوش مصنوعی Google ، Gemini 2.5 Flash ، عملکرد ضعیف تری نسبت به نسخه قبلی خود یعنی Gemini 2.0 Flash انجام داده است. براساس گزارش های داخلی ، مدل جدید به احتمال زیاد متونی تولید می کند که با سیاست های ایمنی گوگل مغایرت دارد. فلش جمینی 2.5 به ترتیب 4.9 درصد و 4.9 درصد کاهش یافته است.

ایمنی مدل ها چیست؟

ایمنی متن میزان نقض سیاست های Google را بر اساس متنی که به مدل داده می شود ، اندازه گیری می کند. در حالی که ایمنی تصویر متن را ارزیابی می کند که مدل در صورت درخواست از یک تصویر به این سیاست ها پایبند است. هر دو آزمایش به طور خودکار و بدون نظارت انسانی انجام می شود. در بیانیه ای که به ایمیل ارسال شده است ، سخنگوی گوگل تأیید کرد که Flash Gemini 2.5 “عملکرد ضعیفی در ایمنی متن و تصویر دارد.”

تلاش شرکت های اطلاعاتی مصنوعی برای افزایش مجوزها

این نتایج غیر منتظره در حالی منتشر می شود که شرکت های اطلاعاتی مصنوعی در تلاشند تا مدل های خود را مجاز تر کنند ، به عبارت دیگر ، کمتر احتمال دارد که به موضوعات بحث برانگیز یا حساس پاسخ ندهند. برای آخرین مدل های لاما ، متا اعلام کرده است که مدل ها را به گونه ای تنظیم کرده است که “برخی از نظرات را تأیید نکند” و به سؤالات سیاسی “بحث برانگیزتر” پاسخ می دهد. Openai همچنین در اوایل سال جاری اعلام کرد که قصد دارد مدلهای آینده خود را تنظیم کند تا موضع نگیرد و دیدگاههای مختلفی را در مورد موضوعات بحث برانگیز ارائه دهد.

عواقب تلاش برای صدور مجوز

بعضی اوقات ، این تلاش ها برای افزایش مجوز منجر به نتایج معکوس می شود. طبق گفته TechCrunch ، مدل قدرتمند پیش فرض Chatgpt Open -Open به نوجوانان اجازه می دهد تا مکالمات شهوانی تولید کنند. Open EI این رفتار را به یک اشکال نسبت داده است. براساس گزارش فنی Google ، Flash Gemini 2.5 ، که هنوز در مرحله پیش نمایش است ، دستورالعمل های وفادار تر به فلش Gemini 2.0 ، از جمله دستورالعمل هایی که از مرزهای مشکل عبور می کنند ، عمل می کند. این شرکت ادعا می کند که کاهش نمرات را می توان تا حدودی مثبت کاذب نسبت داد ، اما همچنین تصدیق می کند که فلش جمینی 2.5 گاهی اوقات هنگام درخواست صریح “تخلف” ایجاد می کند.

در بخشی از گزارش آمده است: “طبیعتاً بین [دنبال کردن دستورالعمل‌ها] “سیاست های ایمنی استرس و تخلفات وجود دارد که در ارزیابی های ما منعکس می شود.”

به گفته توماس وودساید ، یکی از بنیانگذاران پروژه هوش مصنوعی ایمن ، جزئیات محدودی که Google در گزارش فنی خود ارائه داده است ، شفافیت بیشتری را در آزمایش مدل نشان می دهد. وی به TechCrunch گفت: “بین دستورالعمل های زیر و پیروی از خط مشی ها تعادل وجود دارد ، زیرا برخی از کاربران ممکن است محتوا را درخواست کنند که مغایر با سیاست ها باشد.” “در این حالت ، مدل جدید Google Flash به احتمال زیاد به دستورالعمل ها پایبند است ، در حالی که بیشتر سیاست ها در تضاد هستند.”

Google به دلیل مدل های گزارش ایمنی مورد انتقاد قرار گرفته است. این شرکت چندین هفته طول کشید تا گزارش فنی را برای قدرتمندترین مدل خود یعنی Gemini 2.5 Pro منتشر کند. هنگامی که این گزارش در نهایت منتشر شد ، در ابتدا جزئیات کلیدی آزمون ایمنی را از دست داد. روز دوشنبه ، گوگل گزارش مفصلی را با اطلاعات ایمنی اضافی منتشر کرد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیشنهادات سردبیر:

تبلیغات متنی