سال 2024 بهعنوان سال هوش مصنوعی و مدلهای زبانی بزرگ (LLM) به یاد خواهد ماند. در حالی که ChatGPT همچنان به عنوان یکی از بازیگران اصلی باقی مانده و مدلهایی مانند Llama از متا و Claude نیز در حال تکامل هستند، چیزی به پای به گوگل جمینای وجود ندارد. البته موانع و مشکلاتی نیز در این مسیر وجود داشته است، به خصوص در سیستم تولید تصویر Gemini با نام Imagen.
با این حال، ادغام هوش مصنوعی در اپلیکیشنهای Workspace گوگل، این فناوری را به یک ابزار کاربردی و ضروری تبدیل کرده است. همچنین قابلیتهای جدیدی که برای Google Assistant و دستگاههای هوشمند خانگی ارائه داده، بر ارزش آن افزوده است.
جمینای
جمینای تواناییهای هوش مصنوعیهای قبلی گوگل، مانند Bard و Duet، را بازتعریف کرده است. این سیستم در چندین پلتفرم منتشر شد؛ از جمله یک اپلیکیشن اختصاصی برای Android، ادغام در اپلیکیشن گوگل در iOS، و یکپارچگی تدریجی در Google Workspace. گوگل همچنین NotebookLM را معرفی کرد، ابزاری نوآورانه که مانند یک دفترچه یادداشت دیجیتال هوشمند عمل میکند.
تمرکز گوگل بر روی عمیقتر کردن ادغام هوش مصنوعی در محصولات موجود خود بود. برای مثال، Android 15 با بهینهسازی عملکردهای اصلی سیستم عامل، موجب افزایش عمر باتری و بهبود عملکرد شد. همچنین ویژگیهای دوربین مبتنی بر هوش مصنوعی در گوشیهای Pixel را ارتقا داد، که عکاسی محاسباتی را به یک روند جذاب برای سال 2025 تبدیل کرد.
دستاوردها و قابلیتهای جمینای
گوگل در رویداد I/O در ماه May 2023، قابلیتهای احتمالی جمینای را که میتوانست مرزهای تعامل انسان و ماشین را بازتعریف کند، معرفی کرد. وقتی این سیستم راهاندازی شد، انتظارات را برآورده کرد. جمینای به طور یکپارچه متن، کد، و تصاویر را ادغام میکند و به ابزاری کارآمد برای یادگیری، تحقیق، تولید محتوای خلاقانه، و انجام وظایف روزمره تبدیل شد. پنجره متنی گسترده آن که قادر به پردازش اطلاعات بیشتر از هر رقیب دیگری است، جایگاه آن را به عنوان یکی از رهبران هوش مصنوعی تثبیت کرد.
جمینای در سال 2024 به عنوان جایگزینی مناسب برای ChatGPT ظاهر شد. مهارتهای پیشرفته استدلال این سیستم، که امکان مکالمات پیچیدهتر و شبیهتر به انسان را فراهم میکند، استاندارد جدیدی را تعیین کرد. با این حال، تنها ایرادی که کاربران به آن وارد میکنند، مشکلات سیستم تولید تصویر Imagen است.
تولید تصاویر (Imagen)
با وجود پیشرفتهای نوآورانه جمینای، بخش تولید تصویر آن، Imagen، شروع خوبی نداشت. گوگل در ماه فوریه توانایی تولید تصاویر انسانی را به حالت تعلیق درآورد. این قابلیت چند ماه بعد بازگشت، اما به عنوان یک راهحل متوسط. نسخههای اولیه Imagen دچار مشکلاتی از جمله تولید تصاویر نادرست یا عجیب بودند و گوگل به دلیل بروز تعصبات فرهنگی در تصاویر متهم شد.
اگرچه گوگل این مسائل را برطرف کرد، اما آسیب وارد شده به شهرت این سیستم باقی ماند. در بهروزرسانیهای بعدی نیز Imagen نتوانست تأثیر مثبتی ایجاد کند. آنچه ابتدا به عنوان یک ابزار انقلابی تولید تصویر معرفی شده بود، به ضعیفترین بخش سیستم Gemini تبدیل شد.
NotebookLM
در سال 2024، گوگل به طور بیسروصدا یک نوآوری مهم دیگر در هوش مصنوعی را معرفی کرد: NotebookLM. این پروژه آزمایشی رویکرد متفاوتی اتخاذ کرد و بر روی تجربههای شخصیسازیشده هوش مصنوعی متمرکز شد. NotebookLM با آموزش هوش مصنوعی براساس دادههای کاربر، لینکها، تصاویر، ویدیوها، یادداشتها و اسناد را در یک رابط کاربری ساده شبیه دفترچه یادداشت سازماندهی میکند.
این ابزار سریعتر از یک دستیار تحقیقاتی انسانی عمل میکند. از تجربیات من، NotebookLM زمان و تلاش زیادی را در انجام تحقیقات روزمره، ترکیب اطلاعات و وظایف تولیدی صرفهجویی میکند. همچنین در روشن کردن تصویر کلی و مدیریت جزئیات کوچک بسیار کارآمد است.
NotebookLM میتواند یادداشتهای جلسات را خلاصه کند، طرحهای کلی ایجاد کند و با تولید آزمون از اسناد شما، به مطالعه کمک کند. قابلیت Audio Overviews این ابزار نیز امکان ایجاد پادکستهای مجازی پویا و طبیعی از منابع شما را فراهم میکند. با تمرکز بر یک تجربه شخصیسازیشده، جمینای تعریف جدیدی از هوش مصنوعی ارائه میدهد و تأثیر آن را در سال 2025 گسترش میدهد.
اندروید 15
با عرضه اندروید 15، گوگل شروع به استفاده گسترده از هوش مصنوعی در سیستم عامل موبایل خود کرد. این نسخه از اندروید از هوش مصنوعی در دستگاه بهره میبرد تا عملکردهای اصلی را بهینه کند و عمر باتری و عملکرد کلی را بهبود بخشد. این بهینهسازی شامل تخصیص هوشمند منابع، تنظیمات پویا و مدیریت کارآمد فرآیندهای پسزمینه است.
ویژگیهای جدیدی مانند پیشبینی باز کردن اپلیکیشنها، انتخاب هوشمند متن و توصیههای شخصی در تنظیمات سیستم، تجربه کاربری را بهبود بخشیدهاند. این پیشرفتها نشاندهنده تمرکز کامل گوگل بر هوش مصنوعی است.
عکاسی
پیشرفتهای هیجانانگیزی در عکاسی موبایلی به لطف پردازش هوش مصنوعی مشاهده شد. گوشیهای Pixel گوگل که به کیفیت دوربین شهرت دارند، با ویژگیهای هوش مصنوعی به قابلیتهای بالاتری دست یافتند. ابزار Magic Eraser دقیقتر شد و قابلیتهای زوم با پر کردن جزئیات و کاهش نویز بهبود یافت. پیشنهادهای ویرایش خودکار نیز گزینههای جدیدی برای بهبود تصاویر با یک کلیک فراهم کردند.
رقبای گوگل نیز بیکار ننشستهاند. سامسونگ با ابزارهای پیشرفته تشخیص صحنه و بهینهسازی تصویر پیشرفت کرد. این رقابت بین سازندگان منجر به نوآوریهای سریع شد و کاربران گوشیهای هوشمند اکنون میتوانند عکسهای بهتری بگیرند، ویرایش کنند و به اشتراک بگذارند.
چالشها و فرصتهای سال 2025
سال 2024 برای تلاشهای هوش مصنوعی گوگل سال بزرگی بود و با محصولات نوآورانه و ادغام عمیق هوش مصنوعی در اکوسیستم گسترده این شرکت همراه بود. Gemini با قابلیتهای چندحالته و ظرفیت پردازش گسترده خود به یک رهبر در دنیای هوش مصنوعی تبدیل شد و حتی از ChatGPT در برخی موارد پیشی گرفت.
با این حال، سال 2024 پیچیدگیها و چالشهای هوش مصنوعی را نیز نشان داد. مشکلات Imagen و نگرانیهای مربوط به تعصبات فرهنگی و دقت تصاویر، نمونهای از این چالشها بودند. در عین حال، پیشرفتهای گوگل در هوش مصنوعی شخصیسازیشده با NotebookLM، هوش مصنوعی در دستگاهها و عکاسی نشان داد که چگونه این فناوری میتواند زندگی ما را سادهتر و بهتر کند.
با ادامه پیشرفتهای گوگل در حوزه هوش مصنوعی، توسعه مسئولانه باید همچنان در اولویت باشد. هرچند اشتباهات گوگل تاکنون بخشودنی بوده، اما پیشرفتهای آن چشمگیر و شتابان است. با این حال، ما باید هوشیار بمانیم تا از سوءاستفاده افراد بد از هوش مصنوعی، مانند تولید دیپفیکها و تماسهای رباتیک، جلوگیری کنیم.
دیدگاهتان را بنویسید