در جریان رویداد Made By Google 2024، این شرکت برجسته از حالت مکالمه صوتی جدیدی برای «جمنای» به نام Gemini Live پردهبرداری کرد. این دستیار صوتی هماکنون برای مشترکین Gemini Advanced قابل دسترس است. کارایی حالت مکالمه صوتی Gemini Live بسیار شبیه به قابلیت گفتوگوی صوتی در ChatGPT است و امکان انتخاب از بین چندین صدا و مکالمه طبیعی، حتی قطعکردن صحبت بدون نیاز به ضربهزدن روی دکمه را فراهم میکند.
بر اساس گزارش خبرگزاری The Verge، «گوگل» بیان میکند که مکالمات با Gemini Live میتوانند «روان» (Free-Flowing) باشند؛ از این رو، کاربران میتوانند وظایفی مانند قطعکردن پاسخ در وسط جمله یا مکثکردن گفتوگو و بازگشت دوباره به آن را انجام دهند. گفتنی است قابلیت «جمنای لایو» (Gemini Live) در پسزمینه یا هنگام قفلبودن گوشی همراه کار میکند. این شرکت سرشناس قبلاً در کنفرانس توسعهدهندگان I/O خود اعلام کرده بود که قابلیت مذکور بهزودی در دسترس افراد قرار میگیرد تا آنها بتوانند ویدئو را در لحظه تفسیر نمایند.
پشتیبانی از دهها زبان جدید در حالت صوتی Gemini Live
علاوه بر آن، شرکت گوگل 10 صدای جدید را به ابزار هوش مصنوعی «جمنای» اضافه کرده است. این ویژگی از امروز تنها به زبان انگلیسی و برای سیستم عاملهای اندرویدی در دسترس قرار گرفته است. این شرکت آمریکایی در حوزه فناوری میگوید که Gemini Live در هفتههای آینده در دسترس دارندگان گوشیهای «آیاواس» (IOS) نیز قرار خواهد گرفت و زبانهای بیشتری را به کاربران ارائه خواهد داد.
شایان ذکر است که گوگل ویژگیهای دیگری را برای دستیار هوش مصنوعی خود معرفی کرد. این ویژگیها شامل افزونههای جدید برای اپلیکیشنهایی مانند Keep ،Tasks ،Utilities و YouTube Music میشوند که در آینده منتشر خواهند شد. دستیار «جمنای» درک زمینه صفحه نمایش را بهبود بخشیده است که شباهت قابلتوجهی به ویژگیهای هوش مصنوعی معرفیشده توسط شرکت «اپل» (Apple) دارد که در رویداد WWDC امسال معرفی کرده بود.
شرکت Google میگوید «جمنای» میتواند اطلاعاتی مانند مقصد سفر در ویدیوها را استخراج کند و آنها را به نرمافزار Google Map اضافه نماید. نظر شما درباره حالت مکالمه صوتی Gemini Live چیست؟ لطفاً نظرات خود را با ما به اشتراک بگذارید.
دیدگاهتان را بنویسید