رونمایی علی‌بابا از هوش مصنوعی تصویرساز Qwen-Image

شماره خبر: 340444
نام خبرنگار: ابوالفضل نورالدین

Alibaba مدل هوش مصنوعی منبع باز خود را برای ایجاد تصاویر پیشرفته از طریق دستورات متنی به نام QWEN-MIMAGE منتشر کرده است تا با Google و OpenAI وارد رقابت جدی شود.

به گزارش به گزارش میهن تجارت ، علی بابا ، غول فناوری چین ، گام بزرگی در تصویربرداری از رقابت های هوش مصنوعی برداشته و مدل منبع باز قدرتمند خود را در تاریخ 4 آگوست منتشر کرده است. این هوش مصنوعی می تواند متن را به طور دقیق در داخل تصاویر ارائه دهد. این مدل از هوش مصنوعی در دسترس جهانی است و در سیستم عامل هایی مانند بغل کردن صورت در دسترس است. هوش مصنوعی QWEN-MIGE همچنین می تواند از متون پیشرفته و شخصیت های چند رنگ چینی در تصاویر استفاده کند.

این مدل که تحت Apache 2.0 راه اندازی شد ، به طور مستقیم سیستم های غربی Google ، Midjarni و OpenAi را به چالش می کشد. هدف از این هوش مصنوعی فراهم کردن یک سیستم رایگان و قدرتمند است که می تواند دستورات متنی را با خلاقیت بصری ادغام کند ، که برای بسیاری از مدلهای هوش مصنوعی بسیار پیچیده است. اجرای طرح های چند فرهنگی ، درک معنی در سطح پاراگراف و تولید محتوای دو زبانه (چینی و انگلیسی) ویژگی های این مدل است. در عمل ، کاربر می تواند با نوشتن سفارش ، پوستر فیلم ، اسلایدهای نمایش ، صحنه های یک داستان ، شعر دست نوشته و پوسترهای اینفوگرافیک ایجاد کند.

یک قدم عالی در هوش مصنوعی تصویرگر

در مرکز اطلاعات مصنوعی QWEN-Mill ، از مدل پایه 20 میلیارد پارامتر با معماری MMDIT استفاده می شود. از مدل زبان بصری QWEN2.5-VL برای درک لوازم جانبی کاربر پیشرفته استفاده می شود. این معماری قدرتمند از طریق استراتژیک ترین آموزش و خط داده گسترده به دست آمده است. به گفته تیم فنی این هوش مصنوعی ، از یادگیری برنامه درسی برای ساخت این مدل استفاده شده است. این یک استراتژی آموزشی است که یک مدل یادگیری ماشین را از داده های آسانتر تا داده های سخت تر آموزش می دهد.

هوش مصنوعی فراتر از متن

اگرچه ارائه دقیق متن از ویژگی های قابل توجه این مدل است ، اما QWEN-MIAGE ابزاری قدرتمند برای اهداف کلی تولید تصویر است. این سبک های مختلف هنری را پشتیبانی می کند و می تواند صحنه های دنیای واقعی را تولید کند و حتی تصاویری از امپرسیونیسم ، مینیمالیسم و غیره ایجاد کند.

ویرایش ویژگی ها و گزینه های پیشرفته همچنین به کاربر امکان می دهد قبل از مصرف خروجی تغییراتی ایجاد کند. طبق گزارش فنی این مدل ، کاربر می تواند شی را به تصویر اضافه یا حذف کند. این مدل از هوش مصنوعی توانسته است در حرکات مختلف مواردی مانند موهای مو و تغییر بدن را به طور دقیق اجرا کند.

در کنار هوش مصنوعی این تصویرگر ، شرکت چینی اخیراً به روزرسانی جدید خود را در اطلاعات ویدیویی Van2.2 منتشر کرده است. به گفته تحلیلگران ، عرضه هوش مصنوعی علی بابا می تواند گامی عالی در بازار آسیا باشد ، زیرا توسعه ابزارهای هوش مصنوعی در منطقه کمتر بوده است.