تهران سایت > مقالات آموزش هوش مصنوعی > گوگل مدل هوش مصنوعی Gemini را در پاسخ به ChatGPT منتشر کرد!

یکشنبه 19 آذر 1402 زمان خواندن : دقیقه تهران سایت

فهرست مطالب

به ما امتیاز بدهید

Geminiگوگل اعلام کرد، امروز در چت بات Bard راه اندازی می‌شود. گوگل می‌گوید Gemini «قدرتمندترین» مدل هوش مصنوعی است که این شرکت تا به حال راه اندازی کرده است. این هوش مصنوعی روی ویدئو، عکس، صدا و متن آموزش دیده است.

این روزها سخن از سرعت پیشرفت هوش مصنوعی همه را نگران کرده اما این نگرانی‌ها جلودار پیشرفت هوش مصنوعی نیست. یک سال پیش، شرکت OpenAI با انتشار چت جی پی تیChatGPT مسابقه بر سر تولید فناوری هوش مصنوعی را آغاز کرد. حالا گوگل از یک پروژۀ هوش مصنوعی پرده برداشته و قصد دارد غول جستجو را به سردمدار هوش مصنوعی در دنیا تبدیل کند.

شاید بتوان گفت Gemini، بعد از فناوری پیج رنک یا رتبۀ صفحه، مهم‌ترین الگوریتم در تاریخ گوگل است. Gemini مدل جدیدی از هوش مصنوعی است که با متن، عکس و ویدئو سروکار دارد. پیش از این، گوگل با فناوری پیج رنک موتور جستجوی خود را در ذهن عموم مردم جای داد و تبدیل به یک شرکت عظیم و غول‌آسا شد.

gemini-google

هوش مصنوعی گوگل gemini چیست؟

نسخۀ اولیۀ Gemini از امروز به زبان انگلیسی در محیط Bard شروع به کار می‌کند. این نسخه در بیش از 170 کشور و منطقه قابل دسترسی است. گوگل می‌گوید توسعه‌دهندگان می‌توانند از 13 دسامبر از طریق API در فضای ابری گوگل به Gemini دسترسی پیدا کنند. از امروز به بعد، نسخۀ پیچیدۀ Gemini کار پیشنهاد کیبورد در گوشی‌های هوشمند Pixel 8 را بر عهده خواهد داشت. شرکت گوگل می‌گوید «طی چند ماه آینده»، سایر محصولات گوگل، از جمله جستجو (SGE)، تبلیغات (GoogleAds) و کروم، نیز از این تکنولوژی استفاده می‌کنند. قدرتمندترین نسخۀ Gemini در سال 2024 منتشر می‌شود. این نسخه از نظر ایمنی و قابلیت اعتماد برتر و بالاتر است.

دمیس حسابیس[1]، مدیرعامل گوگل دیپ مایند، در مصاحبه با WIRED گفت: «برای ما لحظۀ بزرگی است. از عملکرد Gemini هیجان‌زده هستیم و بیشتر از همه، منتظریم واکنش مردمیم.»

گوگل Gemini را به عنوان یک فناوری توصیف می‌کند که ذاتاً چند حالته است چون برخلاف اکثر مدل‌های بزرگ زبانی در دنیای هوش مولد امروز، فقط روی متن تمرکز ندارد و با تصویر، ویدئو و صدا هم آموزش دیده است. الی کالینز[2]، معاون تولید در گوگل دیپ مایند، در مصاحبۀ خبری گفت: « Gemini بزرگ‌ترین، قدرتمندترین و کامل‌ترین مدل ماست.»

[بهترین سایت های هوش مصنوعی فارسی را بشناسید.]

بیشتر بخوانید :

هوش مصنوعی سخنگو رایگان❤️بهترین سایت هوش مصنوعی سخنگو فارسی

گوگل می‌گوید Gemini سه نسخه دارد: اولترا (بزرگ‌ترین و قدرتمندترین مدل)، نانو (که کوچک‌تر و کاربردی‌تر است) و پرو (در سطح متوسط با قابلیت‌های میان‌رده).

از امروز، Gemini Pro به چت بات Bard، که شبیه به ChatGPT است، اضافه می‌شود. شرکت گوگل می‌گوید چت بات Bard با این تغییر از نظر استدلال و برنامه‌ریزی ارتقا پیدا می‌کند. امروز، نسخۀ تخصصی Gemini Pro در نسخۀ جدید AlphaCode ادغام می‌شود. AlphaCode یک ابزار مولد برای برنامه‌نویسی است که توسط گوگل دیپ مایند متشر شد. قدرتمندترین نسخۀ Gemini، یعنی اولترا، در چت بات Bard تعبیه می‌شود و در سال 2024 از طریق API فضای ابری در دسترس قرار می‌گیرد.

سیسی شائو[3]، معاون گوگل و مدیر کل Bard، می‌گوید قابلیت‌های چندمودی Gemini مهارت‌های جدید را در اختیار Bard قرار می‌دهد و باعث می‌شود Bard در انجام وظایفی مثل خلاصه‌نویسی، ایده‌پردازی، نوشتن و برنامه‌ریزی بهتر شود. شائو می‌گوید: «این موارد جزو بزرگ‌ترین پیشرفت‌های کیفی Bard از زمان راه اندازی است.»

{ هوش مصنوعی علاوه بر ساخت عکس، ادیت ویدیو و .. دارای قابلیت نوشتن مقاله نیز است که شما می‌توانید برای کسب اطلاعات بیشتر راجب بهترین هوش مصنوعی نوشتن مقاله روی لینک مقاله کلیک کنید.}

gemini

نسخۀ جدید هوش مصنوعی گوگل جمینی

گوگل با انتشار چند دمو توانایی Gemini در حل مشکلات مربوط به اطلاعات بصری را نشان داد. در یکی از این کلیپ‌ها، Gemini به یک ویدئو واکنش نشان می‌دهد. یک نفر در ویدئو با کشیدن تصاویر مختلف یک پازل ساده درست می‌کند و از Geminiمی‌خواهد راجع به نقشۀ جهان ایدۀ بازی درست کند. همچنین، دو محقق گوگل نشان دادند که Gemini می‌تواند به سوالات مربوط به یک مقاله همراه با عکس و معادله جواب دهد. پس به تحقیقات علمی کمک می‌کند.

کالینز می‌گوید Gemini Pro، یعنی مدلی که این هفته راه اندازی می‌شود، در شش مورد از هشت معیار برای آزمایش هوش نرم افزار هوش مصنوعی بهتر از مدل قدیمی GPT-3.5 عمل کرد.

گوگل می‌گوید Gemini Ultra، نسخه‌ای که سال آینده منتشر می‌شود، نود درصد امتیاز را در زمینۀ MMLU یا درک زبان چندوظیفه‌ای به دست آورده که از سایر مدل‌ها (از جمله GPT-4) بالاتر است. محققان آکادمیک برای آزمایش مدل‌های زبانی از نظر پاسخ‌دهی به سوالات رشته‌های مختلف از جمله ریاضی، تاریخ آمریکا و حقوق از این معیار استفاده می‌کنند.

کالینز می‌گوید: «Gemini در اکثر حوزه‌ها پیشرفته‌ترین مدل است و از بین 32 حوزۀ پرکاربرد در جامعۀ تحقیقاتی یادگیری ماشین، 30 حوزه را پوشش می‌دهد. بنابراین، می‌توان این فناوری را در خط مقدم تصور کرد.»

بیشتر بخوانید :

گوگل محتوای هوش مصنوعی AI را تشخیص می دهد؟

[بهترین سایت هوش مصنوعی را بشناسید.]

OpenAI با انتشار GPT-4 در مارس 2023 (که در حال حاضر، از قدرتمندترین نسخۀ ChatGPT پشتیبانی می‌کند) هوش از سر همه پراند. انتشار این نسخه باعث شد برخی از محققان در نگاه خود به نقش هوش مصنوعی در رقابت با هوش انسان تجدید نظر کنند. OpenAI از GPT-4 به عنوان یک فناوری چندمودی نام برد و در سپتامبر ChatGPT را ارتقا داد تا عکس و صدا را پردازش کند اما نگفت آیا مدل GPT-4 مستقیماً روی چیزی غیر از متن آموزش دیده یا خیر. ChatGPT به کمک یک مدل دیگر به اسم DALL-E 2 توانایی خلق تصویر را دارد.

امروز گوگل با انتشار یک گزارش فنی از جزئیات سازوکار Gemini پرده برداشت. البته این گزارش، جزئیات ساختار، اندازۀ مدل هوش مصنوعی یا مجموعه اطلاعات مورد استفاده برای آموزش مدل را فاش نمی‌کند.

فرایند تعلیم مدل‌های بزرگ هوش مصنوعی با چیپ‌های قدرتمند کامپیوتر بسیار طولانی و پرهزینه است. بنابراین، کارشناسان می‌گویند به احتمال زیاد گوگل صدها میلیون دلار هزینه کرده است. گفته می‌شود گوگل از یک طراحی جدید و ترکیبی از داده‌های آموزشی بهره برده است. شرکت گوگل سرعت انشار فناوری هوش مصنوعی را بالا برده و در این مسیر، از منابع مختلف بهره برده تا سروصدای ChatGPT از شرکت OpenAI را بخواباند و دوباره به عنوان شرکت سردمدار هوش مصنوعی در دنیا سر زبان‌ها بیفتد.

اورن اتزیونی[4]، استاد بازنشستۀ دانشگاه واشینگتون و مدیر عامل سابق موسسۀ هوش مصنوعی آلن، می‌گوید: «یه جورایی مسابقۀ کی از کی بهتره و این به اون در راه افتاده. قطعاً Gemini بهتر از GPT-4 خواهد بود اما نسخۀ بعدی، یعنی GPT-5، بهتر عمل می‌کنه.»

اتزیونی می‌گوید مدل‌های بزرگ و غول‌آسا مثل Gemini صدها میلیون دلار هزینه به دنبال دارند اما سودی که به شرکت برمی‌گردد، میلیاردها یا تریلیاردها دلار خواهد بود. او می‌گوید: «این جنگ بازنده ندارد.»

[درباره هوش مصنوعی المنتور وردپرس Elementor AI با آسان ترین روش نصب اطلاعات جامعی برای کمک به طراحی سایت وردپرس، سئو و تولید محتوا کسب کنید.]

چت-gemini

مقابله به مثل gemini با Chat GPT

گوگل موفق شد در زمینۀ ChatGPT چند روش کلیدی اختراع کند اما نتوانست قبل از OpenAI مدل خود را ارائه دهد. یکی از دلایل این ناکامی، ترس گوگل از جواب‌های ناشایست یا خطرناک ChatGPT بود. گوگل می‌گوید در رابطه با Gemini تمام جوانب امنیتی را در نظر گرفته چون این مدل قابلیت‌های بیشتر و گسترده‌تر دارد.

Gemini با استفاده از مجموعه اطلاعات مدل‌های سمی مورد آزمایش قرار گرفت. این مدل‌ها توسط موسسۀ هوش مصنوعی آلن در دسترس قرار گرفت. کالینز می‌گوید گوگل در حال همکاری با محققان خارجی است تا تمام نقاط ضعف مدل پیدا شود. کالینز بدون اشاره به جزئیات گفت قدرت برتر Gemini باعث می‌شود حساسیت گوگل روی کنترل کیفیت و امنیت بالا برود.

بیشتر بخوانید :

کاربرد هوش مصنوعی در سئو

این الگوریتم جدید برای گوگل و شرکت مادر، آلفابت، مزایای زیادی به همراه دارد. شرکت آلفابت طی یک دهۀ گذشته قابلیت پژوهش در زمینۀ هوش مصنوعی را فراهم کرد. امروزه میلیون‌ها توسعه‌دهنده از الگوریتم OpenAI استفاده می‌کنند و مایکروسافت از این تکنولوژی برای اضافه کردن ویژگی‌های جدید به سیستم عامل و نرم‌افزار خود بهره می‌برد. این مسئله گوگل را به تجدید نظر واداشت تا روی این تکنولوژی متمرکز شود.

گوگل اولین بار در کنفرانس I/O که در ماه مه برگزار شد، اعلام کرد در حال کار روی Gemini است. این شرکت همزمان در تلاش بود تا هوش مصنوعی مولد را به جستجو اضافه کند تا بتواند از محبوبیت ChatGPT پیشی بگیرد و با خطر کاربرد این تکنولوژی در موتور جستجوی بینگ مقابله کند. برآوردها نشان می‌دهد گوگل هنوز بیش از 90 درصد از بازار جستجوی جهانی سهم دارد اما به نظر می‌رسد راه اندازی Gemini سهم این شرکت را در واکنش به ChatGPT بیشتر خواهد کرد.

در آوریل 2023، گروه تحقیقاتی گوگل در زمینۀ هوش مصنوعی (Google Brain) با واحد هوش مصنوعی گوگل در لندن (DeepMind) ادغام شد و دپارتمان Google DeepMind به وجود آمد. این دپارتمان، در واکنش به ChatGPT تشکیل شد و در نهایت به تولید Gemini انجامید. اما طی چند ماه گذشته، محققان و مهندسان از سراسر گوگل به پروژۀ Gemini اضافه شدند. در این پروژه از نسخۀ جدید چیپ‌های سیلیکونی گوگل برای آموزش به مدل‌های هوش مصنوعی، به نام واحد پردازشی تنسور (TPUs)، استفاده شد.

نام Gemini برگرفته از ادغام دو آزمایشگاه اصلی هوش مصنوعی گوگل است و به پروژۀ Gemini ناسا اشاره دارد که راه را برای فرود آپولو روی ماه هموار ساخت.

[1] Demis Hassabis

[2] Eli Collins

[3] Sissie Hsiao

[4] Oren Etzioni

بدون دیدگاه

دیدگاهتان را بنویسید