اولین نماینده هوش مصنوعی OpenAI به نام Operator معرفی شده است. این ابزار میتواند وظایفی مانند رزرو شام و انجام دیگر کارها در وب را برای شما انجام دهد.
OpenAI همواره به دنبال اضافهکردن قابلیتهای جدید به ChatGPT است. پس از ماهها شایعه و گزارشهایی که اخیراً منتشر شد، اولین نماینده هوش مصنوعی این شرکت اکنون عرضه شده است. Operator طراحی شده تا با فشردن یک کلید، وظایف وب را برای شما انجام دهد.
Operator چیست؟
به طور کلی، Operator یک واسطه استفاده از کامپیوتر (CUA) است که از قابلیتهای بصری مدل GPT-4o برای مرور و جستجو در وب استفاده میکند. این بدین معناست که Operator میتواند مفهوم چیزی که باید جستجو شود را درک کند و به لطف چندوجهی بودنش، آنچه در وب میبیند را متوجه میشود. این ابزار در حال حاضر به صورت پیشنمایش تحقیقاتی برای کاربران ChatGPT Pro در ایالات متحده در دسترس است.
ویژگیها و قابلیتها
Operator به عنوان واسطهای که میتواند از مرورگر خود برای انجام وظایف شما استفاده کند، توصیف شده است. OpenAI یک دموی کاربردی منتشر کرده که در آن Operator همانند انسانها وبگردی میکند. شما میتوانید از Operator بخواهید تا برای شما یک میز در رستوران رزرو کرده، فرمهای طولانی را پر کند، مواد غذایی سفارش دهد یا حتی یک بلیط هواپیما رزرو کند. در دمو، نشان داده شد که این ابزار میتواند از OpenTable برای جستجو و رزرو در رستوران استفاده کند. همچنین Operator مراحل انجام کار را برای شما توضیح میدهد.
محدودیتها و وضعیت فعلی
Operator هنوز در مرحله پیشنمایش تحقیقاتی قرار دارد، بنابراین در روزهای اولیه توسعه خود بوده و OpenAI محدودیتهایی برای آن اعمال کرده است. . راهاندازی این ابزار اولین ورود OpenAI به دنیای واسطههاس هوش مصنوعی است که احتمالاً در سال جاری، موضوع اصلی در حوزه هوش مصنوعی خواهد بود.
OpenAI در یک پست وبلاگی نوشت: Operator یکی از اولین نمایندههای ماست؛ هوش مصنوعیهایی که میتوانند به طور مستقل برای شما کار انجام دهند—شما وظیفهای به آن میدهید و آن را اجرا میکند.
این جمله نشان میدهد که نمایندگان دیگری نیز در دست توسعه هستند. سم آلتمن (مدیرعامل OpenAI) این موضوع را در دموی زنده تأیید کرد. همه این نمایندگان حول محور انجام وظایف برای کاربران طراحی شدهاند—یک گام بزرگ در جهت مفیدترکردن هوش مصنوعی و بازگرداندن بخشی از زمان به کاربران.
فناوری پشت Operator
Operator از مدل جدید واسطه استفاده از کامپیوتر (CUA) قدرت میگیرد که مهارتهای بصری GPT-4o را با توانایی استدلال پیشرفته ترکیب میکند. این قابلیتها به Operator این امکان را میدهد که عناصر داخل یک مرورگر—نوار جستجو، کلیدها و محتوای روی صفحه—را بفهمد و از آنها استفاده کند.
OpenAI توضیح میدهد که Operator میتواند با استفاده از اسکرینشاتها، ببیند و با استفاده از تمام عملکردهای یک ماوس و صفحهکلید، تعامل کند.
این قابلیت به Operator اجازه میدهد به طور مؤثری از مرورگر برای انجام وظایف استفاده کند. این موضوع بسیار جالب است، به ویژه اگر بتواند با نرخ موفقیت بالا کار کند. طبق پست وبلاگ، Operator حتی میتواند خود را اصلاح کند.
آینده و دسترسی
مانند اکثر ابزارها و قابلیتهای جدید هوش مصنوعی، مدتی زمان میبرد تا Operator به طور کامل در دنیای واقعی مفید شود. همچنین OpenAI باید آن را در اختیار کاربران بیشتری قرار دهد. با این حال، به عنوان یک پیشنمایش تحقیقاتی، بسیار تأثیرگذار است.
در حال حاضر، فقط اگر در ایالات متحده زندگی میکنید و مشترک ChatGPT Pro هستید، میتوانید آن را در وبسایت OpenAI امتحان کنید. سم آلتمن اعلام کرده که این قابلیت به تدریج در دیگر کشورها نیز عرضه میشود و به اشتراک ChatGPT Plus اضافه خواهد شد. بر اساس برخی از اعلامیههای OpenAI، احتمالاً اروپا کمی دیرتر به این ابزار دسترسی پیدا خواهد کرد.
دیدگاهتان را بنویسید