یکشنبه 19 آذر 1402 زمان خواندن : دقیقه
فهرست مطالب
Geminiگوگل اعلام کرد، امروز در چت بات Bard راه اندازی میشود. گوگل میگوید Gemini «قدرتمندترین» مدل هوش مصنوعی است که این شرکت تا به حال راه اندازی کرده است. این هوش مصنوعی روی ویدئو، عکس، صدا و متن آموزش دیده است.
این روزها سخن از سرعت پیشرفت هوش مصنوعی همه را نگران کرده اما این نگرانیها جلودار پیشرفت هوش مصنوعی نیست. یک سال پیش، شرکت OpenAI با انتشار چت جی پی تیChatGPT مسابقه بر سر تولید فناوری هوش مصنوعی را آغاز کرد. حالا گوگل از یک پروژۀ هوش مصنوعی پرده برداشته و قصد دارد غول جستجو را به سردمدار هوش مصنوعی در دنیا تبدیل کند.
شاید بتوان گفت Gemini، بعد از فناوری پیج رنک یا رتبۀ صفحه، مهمترین الگوریتم در تاریخ گوگل است. Gemini مدل جدیدی از هوش مصنوعی است که با متن، عکس و ویدئو سروکار دارد. پیش از این، گوگل با فناوری پیج رنک موتور جستجوی خود را در ذهن عموم مردم جای داد و تبدیل به یک شرکت عظیم و غولآسا شد.
هوش مصنوعی گوگل gemini چیست؟
نسخۀ اولیۀ Gemini از امروز به زبان انگلیسی در محیط Bard شروع به کار میکند. این نسخه در بیش از 170 کشور و منطقه قابل دسترسی است. گوگل میگوید توسعهدهندگان میتوانند از 13 دسامبر از طریق API در فضای ابری گوگل به Gemini دسترسی پیدا کنند. از امروز به بعد، نسخۀ پیچیدۀ Gemini کار پیشنهاد کیبورد در گوشیهای هوشمند Pixel 8 را بر عهده خواهد داشت. شرکت گوگل میگوید «طی چند ماه آینده»، سایر محصولات گوگل، از جمله جستجو (SGE)، تبلیغات (GoogleAds) و کروم، نیز از این تکنولوژی استفاده میکنند. قدرتمندترین نسخۀ Gemini در سال 2024 منتشر میشود. این نسخه از نظر ایمنی و قابلیت اعتماد برتر و بالاتر است.
دمیس حسابیس[1]، مدیرعامل گوگل دیپ مایند، در مصاحبه با WIRED گفت: «برای ما لحظۀ بزرگی است. از عملکرد Gemini هیجانزده هستیم و بیشتر از همه، منتظریم واکنش مردمیم.»
گوگل Gemini را به عنوان یک فناوری توصیف میکند که ذاتاً چند حالته است چون برخلاف اکثر مدلهای بزرگ زبانی در دنیای هوش مولد امروز، فقط روی متن تمرکز ندارد و با تصویر، ویدئو و صدا هم آموزش دیده است. الی کالینز[2]، معاون تولید در گوگل دیپ مایند، در مصاحبۀ خبری گفت: « Gemini بزرگترین، قدرتمندترین و کاملترین مدل ماست.»
[بهترین سایت های هوش مصنوعی فارسی را بشناسید.]
گوگل میگوید Gemini سه نسخه دارد: اولترا (بزرگترین و قدرتمندترین مدل)، نانو (که کوچکتر و کاربردیتر است) و پرو (در سطح متوسط با قابلیتهای میانرده).
از امروز، Gemini Pro به چت بات Bard، که شبیه به ChatGPT است، اضافه میشود. شرکت گوگل میگوید چت بات Bard با این تغییر از نظر استدلال و برنامهریزی ارتقا پیدا میکند. امروز، نسخۀ تخصصی Gemini Pro در نسخۀ جدید AlphaCode ادغام میشود. AlphaCode یک ابزار مولد برای برنامهنویسی است که توسط گوگل دیپ مایند متشر شد. قدرتمندترین نسخۀ Gemini، یعنی اولترا، در چت بات Bard تعبیه میشود و در سال 2024 از طریق API فضای ابری در دسترس قرار میگیرد.
سیسی شائو[3]، معاون گوگل و مدیر کل Bard، میگوید قابلیتهای چندمودی Gemini مهارتهای جدید را در اختیار Bard قرار میدهد و باعث میشود Bard در انجام وظایفی مثل خلاصهنویسی، ایدهپردازی، نوشتن و برنامهریزی بهتر شود. شائو میگوید: «این موارد جزو بزرگترین پیشرفتهای کیفی Bard از زمان راه اندازی است.»
{ هوش مصنوعی علاوه بر ساخت عکس، ادیت ویدیو و .. دارای قابلیت نوشتن مقاله نیز است که شما میتوانید برای کسب اطلاعات بیشتر راجب بهترین هوش مصنوعی نوشتن مقاله روی لینک مقاله کلیک کنید.}
نسخۀ جدید هوش مصنوعی گوگل جمینی
گوگل با انتشار چند دمو توانایی Gemini در حل مشکلات مربوط به اطلاعات بصری را نشان داد. در یکی از این کلیپها، Gemini به یک ویدئو واکنش نشان میدهد. یک نفر در ویدئو با کشیدن تصاویر مختلف یک پازل ساده درست میکند و از Geminiمیخواهد راجع به نقشۀ جهان ایدۀ بازی درست کند. همچنین، دو محقق گوگل نشان دادند که Gemini میتواند به سوالات مربوط به یک مقاله همراه با عکس و معادله جواب دهد. پس به تحقیقات علمی کمک میکند.
کالینز میگوید Gemini Pro، یعنی مدلی که این هفته راه اندازی میشود، در شش مورد از هشت معیار برای آزمایش هوش نرم افزار هوش مصنوعی بهتر از مدل قدیمی GPT-3.5 عمل کرد.
گوگل میگوید Gemini Ultra، نسخهای که سال آینده منتشر میشود، نود درصد امتیاز را در زمینۀ MMLU یا درک زبان چندوظیفهای به دست آورده که از سایر مدلها (از جمله GPT-4) بالاتر است. محققان آکادمیک برای آزمایش مدلهای زبانی از نظر پاسخدهی به سوالات رشتههای مختلف از جمله ریاضی، تاریخ آمریکا و حقوق از این معیار استفاده میکنند.
کالینز میگوید: «Gemini در اکثر حوزهها پیشرفتهترین مدل است و از بین 32 حوزۀ پرکاربرد در جامعۀ تحقیقاتی یادگیری ماشین، 30 حوزه را پوشش میدهد. بنابراین، میتوان این فناوری را در خط مقدم تصور کرد.»
[بهترین سایت هوش مصنوعی را بشناسید.]
OpenAI با انتشار GPT-4 در مارس 2023 (که در حال حاضر، از قدرتمندترین نسخۀ ChatGPT پشتیبانی میکند) هوش از سر همه پراند. انتشار این نسخه باعث شد برخی از محققان در نگاه خود به نقش هوش مصنوعی در رقابت با هوش انسان تجدید نظر کنند. OpenAI از GPT-4 به عنوان یک فناوری چندمودی نام برد و در سپتامبر ChatGPT را ارتقا داد تا عکس و صدا را پردازش کند اما نگفت آیا مدل GPT-4 مستقیماً روی چیزی غیر از متن آموزش دیده یا خیر. ChatGPT به کمک یک مدل دیگر به اسم DALL-E 2 توانایی خلق تصویر را دارد.
امروز گوگل با انتشار یک گزارش فنی از جزئیات سازوکار Gemini پرده برداشت. البته این گزارش، جزئیات ساختار، اندازۀ مدل هوش مصنوعی یا مجموعه اطلاعات مورد استفاده برای آموزش مدل را فاش نمیکند.
فرایند تعلیم مدلهای بزرگ هوش مصنوعی با چیپهای قدرتمند کامپیوتر بسیار طولانی و پرهزینه است. بنابراین، کارشناسان میگویند به احتمال زیاد گوگل صدها میلیون دلار هزینه کرده است. گفته میشود گوگل از یک طراحی جدید و ترکیبی از دادههای آموزشی بهره برده است. شرکت گوگل سرعت انشار فناوری هوش مصنوعی را بالا برده و در این مسیر، از منابع مختلف بهره برده تا سروصدای ChatGPT از شرکت OpenAI را بخواباند و دوباره به عنوان شرکت سردمدار هوش مصنوعی در دنیا سر زبانها بیفتد.
اورن اتزیونی[4]، استاد بازنشستۀ دانشگاه واشینگتون و مدیر عامل سابق موسسۀ هوش مصنوعی آلن، میگوید: «یه جورایی مسابقۀ کی از کی بهتره و این به اون در راه افتاده. قطعاً Gemini بهتر از GPT-4 خواهد بود اما نسخۀ بعدی، یعنی GPT-5، بهتر عمل میکنه.»
اتزیونی میگوید مدلهای بزرگ و غولآسا مثل Gemini صدها میلیون دلار هزینه به دنبال دارند اما سودی که به شرکت برمیگردد، میلیاردها یا تریلیاردها دلار خواهد بود. او میگوید: «این جنگ بازنده ندارد.»
[درباره هوش مصنوعی المنتور وردپرس Elementor AI با آسان ترین روش نصب اطلاعات جامعی برای کمک به طراحی سایت وردپرس، سئو و تولید محتوا کسب کنید.]
مقابله به مثل gemini با Chat GPT
گوگل موفق شد در زمینۀ ChatGPT چند روش کلیدی اختراع کند اما نتوانست قبل از OpenAI مدل خود را ارائه دهد. یکی از دلایل این ناکامی، ترس گوگل از جوابهای ناشایست یا خطرناک ChatGPT بود. گوگل میگوید در رابطه با Gemini تمام جوانب امنیتی را در نظر گرفته چون این مدل قابلیتهای بیشتر و گستردهتر دارد.
Gemini با استفاده از مجموعه اطلاعات مدلهای سمی مورد آزمایش قرار گرفت. این مدلها توسط موسسۀ هوش مصنوعی آلن در دسترس قرار گرفت. کالینز میگوید گوگل در حال همکاری با محققان خارجی است تا تمام نقاط ضعف مدل پیدا شود. کالینز بدون اشاره به جزئیات گفت قدرت برتر Gemini باعث میشود حساسیت گوگل روی کنترل کیفیت و امنیت بالا برود.
این الگوریتم جدید برای گوگل و شرکت مادر، آلفابت، مزایای زیادی به همراه دارد. شرکت آلفابت طی یک دهۀ گذشته قابلیت پژوهش در زمینۀ هوش مصنوعی را فراهم کرد. امروزه میلیونها توسعهدهنده از الگوریتم OpenAI استفاده میکنند و مایکروسافت از این تکنولوژی برای اضافه کردن ویژگیهای جدید به سیستم عامل و نرمافزار خود بهره میبرد. این مسئله گوگل را به تجدید نظر واداشت تا روی این تکنولوژی متمرکز شود.
گوگل اولین بار در کنفرانس I/O که در ماه مه برگزار شد، اعلام کرد در حال کار روی Gemini است. این شرکت همزمان در تلاش بود تا هوش مصنوعی مولد را به جستجو اضافه کند تا بتواند از محبوبیت ChatGPT پیشی بگیرد و با خطر کاربرد این تکنولوژی در موتور جستجوی بینگ مقابله کند. برآوردها نشان میدهد گوگل هنوز بیش از 90 درصد از بازار جستجوی جهانی سهم دارد اما به نظر میرسد راه اندازی Gemini سهم این شرکت را در واکنش به ChatGPT بیشتر خواهد کرد.
در آوریل 2023، گروه تحقیقاتی گوگل در زمینۀ هوش مصنوعی (Google Brain) با واحد هوش مصنوعی گوگل در لندن (DeepMind) ادغام شد و دپارتمان Google DeepMind به وجود آمد. این دپارتمان، در واکنش به ChatGPT تشکیل شد و در نهایت به تولید Gemini انجامید. اما طی چند ماه گذشته، محققان و مهندسان از سراسر گوگل به پروژۀ Gemini اضافه شدند. در این پروژه از نسخۀ جدید چیپهای سیلیکونی گوگل برای آموزش به مدلهای هوش مصنوعی، به نام واحد پردازشی تنسور (TPUs)، استفاده شد.
نام Gemini برگرفته از ادغام دو آزمایشگاه اصلی هوش مصنوعی گوگل است و به پروژۀ Gemini ناسا اشاره دارد که راه را برای فرود آپولو روی ماه هموار ساخت.
[1] Demis Hassabis
[2] Eli Collins
[3] Sissie Hsiao
[4] Oren Etzioni
بدون دیدگاه