เมื่อวันพุธที่ผ่านมา Google ได้เปิดตัว “Gemini 2.0” และเรียกว่าเป็นชุดโมเดลปัญญาประดิษฐ์ที่ “ทรงพลังที่สุด” เท่าที่เคยมีมาให้กับทุกคนได้ใช้งาน ซึ่งก่อนหน้านี้เมื่อเดือนธันวาคม Google ได้เปิดให้สิทธิ์นักพัฒนาได้ลองทดสอบใช้งานโมเดลใหม่นี้ พร้อมกับเปิดให้ใช้ฟีเจอร์ใหม่บางอย่างที่ผูกเข้ากับผลิตภัณฑ์ของ Google ไปแล้ว ส่วนครั้งนี้เป็นการเปิดตัวสู่สาธารณะเป็นครั้งแรก
อีกทั้ง การเปิดตัวครั้งนี้ยังเป็นการย้ำถึงการพัฒนา Gemini ที่มีมาอย่างต่อเนื่อง และยังเป็นส่วนหนึ่งของกลยุทธ์ที่ Google กำลังลงทุนอย่างหนักใน AI agents ท่ามกลางการแข่งขันด้าน AI ที่เข้มข้นขึ้นระหว่างบริษัทยักษ์ใหญ่ด้านเทคโนโลยีและสตาร์ทอัพ
สำหรับ Gemini 2.0 ชุดโมเดลนี้จะประกอบไปด้วย
ค่าใช้จ่ายในการใช้งาน Gemini Flash จะอยู่ที่ 0.10 ดอลลาร์ต่อ 1 ล้านโทเค็น สำหรับอินพุตที่เป็นข้อความ รูปภาพ และวิดีโอ ส่วน Flash-Lite ซึ่งเป็นเวอร์ชันที่ประหยัดกว่ามีค่าใช้จ่าย 0.0075 ดอลลาร์ต่อ 1 ล้านโทเค็น
Google เคยออกมากล่าวในบล็อกโพสต์เมื่อเดือนธันวาคม ว่า Gemini 2.0 มีความก้าวหน้าด้านมัลติโมดัล (Multimodality) เช่น ความสามารถในการสร้างผลลัพธ์ที่เป็นภาพและเสียง รวมถึงสามารถใช้เครื่องมือต่าง ๆ ได้ นอกจากนี้ ตระกูลโมเดล Gemini ยังช่วยให้ Google สามารถสร้าง AI agents รุ่นใหม่ที่เข้าใกล้วิสัยทัศน์ของการเป็นผู้ช่วยอัจฉริยะมากขึ้น
เช่นเดียวกันกับบริษัทเทคโนโลยีอื่น ๆ อย่างเช่น Meta, Amazon, Microsoft, OpenAI และ Anthropic ก็กำลังมุ่งสู่การพัฒนา Agentic AI หรือโมเดลที่สามารถทำงานที่ซับซ้อนหลายขั้นตอนแทนผู้ใช้ โดยไม่จำเป็นต้องให้ผู้ใช้คอยกำกับทุกขั้นตอนด้วยเช่นกัน
ที่ผ่านมา Anthropic สตาร์ทอัพด้าน AI ที่ได้รับการสนับสนุนจาก Amazon และก่อตั้งโดยอดีตผู้บริหารฝ่ายวิจัยของ OpenAI และยังถือว่าเป็นหนึ่งในคู่แข่งสำคัญในสงครามพัฒนา AI agents เปิดเผยว่า AI ของบริษัทสามารถใช้งานและทำงานเองบนคอมพิวเตอร์ได้เหมือนมนุษย์ โดยสามารถทำงานที่ซับซ้อนได้ อย่างเช่น สามารถอ่านข้อความบนหน้าจอ เลือกปุ่ม กรอกข้อความ นำทางเว็บไซต์ และทำงานบนซอฟต์แวร์ต่าง ๆ รวมถึงเรียกดูข้อมูลจากอินเทอร์เน็ตแบบเรียลไทม์ได้
นอกจากนี้ ทาง OpenAI ก็ได้เปิดตัวฟีเจอร์ที่คล้ายคลึงกันในชื่อว่า “Operator” สามารถทำงานได้อัตโนมัติแทนผู้ใช้ เช่น วางแผนท่องเที่ยว กรอกแบบฟอร์ม จองร้านอาหาร และสั่งซื้อของชำ โดย OpenAI ที่ได้รับการสนับสนุนจาก Microsoft อธิบายว่า Operator เป็น “ตัวแทนที่สามารถเข้าไปยังเว็บไซต์และทำงานแทนคุณได้”
และเมื่อต้นสัปดาห์ที่ผ่านมา OpenAI ยังได้เปิดตัว Deep Research ที่จะให้ AI Agent รวบรวมและวิเคราะห์รายงานวิจัยที่ซับซ้อน ตามคำถามและหัวข้อที่ผู้ใช้ต้องการ
ทางด้าน Google เองก็ได้เปิดตัวเครื่องมือที่มีชื่อเดียวกันว่า Deep Research เมื่อเดือนธันวาคม ซึ่งทำหน้าที่เป็น “ผู้ช่วยวิจัย” ค้นคว้าหัวข้อที่ซับซ้อนและสรุปรายงานให้ผู้ใช้ พร้อมกันนี้ Google ยังมีแผนจะเปิดตัวฟีเจอร์ AI อีกหลายตัวในช่วงต้นปี 2025 อีกด้วย
Sundar Pichai ซีอีโอของ Google กล่าวว่า “คุณไม่จำเป็นต้องเป็นเจ้าแรกเสมอไป แต่คุณต้องดำเนินกลยุทธ์ให้ดีและสร้างผลิตภัณฑ์ที่ดีที่สุด และผมคิดว่านั่นคือเป้าหมายของปี 2025 ของเรา”
ที่มา: CNBC
ติดตามเพจ Facebook: Thairath Money ได้ที่ลิงก์นี้ - https://www.facebook.com/ThairathMoney