Interactions API เป็นอินเทอร์เฟซใหม่ของเราและเป็นวิธีที่ตรงไปตรงมาที่สุดในการสร้างด้วยโมเดลและ Agent ของ Gemini โดยจะพร้อมใช้งานโดยทั่วไปและเป็นอินเทอร์เฟซที่แนะนำสำหรับโปรเจ็กต์ใหม่ทั้งหมดตั้งแต่เดือนมิถุนายน 2026 เป็นต้นไป
แม้ว่าตอนนี้จะถือว่าเป็น API เดิมแล้ว แต่ API ดั้งเดิม
generateContent
ยังคงได้รับการสนับสนุนอย่างเต็มที่
เหตุใดจึงต้องใช้ Interactions API
- ความสามารถใหม่ที่พร้อมใช้งาน: สถานะการสนทนาฝั่งเซิร์ฟเวอร์ที่ไม่บังคับโดยใช้
previous_interaction_id, ขั้นตอนการดำเนินการที่สังเกตได้สำหรับการแก้ไขข้อบกพร่องและการแสดงผล UI รวมถึงการดำเนินการเบื้องหลังสำหรับงานที่ใช้เวลานานโดยใช้background=true. - ต้นทุนที่ต่ำลงด้วยอัตราการพบแคชที่สูงขึ้น: การจัดการสถานะฝั่งเซิร์ฟเวอร์ช่วยให้การแคชบริบทมีประสิทธิภาพมากขึ้นในแต่ละรอบ ซึ่งช่วยลดต้นทุนโทเค็นสำหรับการสนทนาไปมา
- สร้างขึ้นสำหรับโมเดลและ Agent ระดับแนวหน้า: สร้างขึ้นโดยเฉพาะสำหรับโมเดลการคิด การใช้เครื่องมือหลายขั้นตอน และโฟลว์การให้เหตุผลที่ซับซ้อน ซึ่งช่วยลดความซับซ้อนของกระบวนการสร้าง การแก้ไขข้อบกพร่อง และการจัดระเบียบแอปพลิเคชัน Agent
- API เดียวสำหรับโมเดลและ Agent: อินเทอร์เฟซเดียวที่ผสานรวมสำหรับการเรียกใช้ โมเดลและ Agent ของ Gemini โดยตรง เช่น Deep Research และ Agent ที่มีการจัดการที่กำหนดเอง โดยไม่ต้องเรียนรู้ปลายทางหรือรูปแบบที่แยกต่างหาก
- ที่ที่จะเปิดตัวสิ่งใหม่ๆ: ในอนาคต โมเดลและความสามารถใหม่ๆ นอกเหนือจากตระกูลหลัก รวมถึงความสามารถและเครื่องมือ Agent ใหม่ๆ จะเปิดตัวใน Interactions API
โดยค่าเริ่มต้น Interactions API จะจัดเก็บคำขอเพื่อให้คุณใช้ประโยชน์จากฟีเจอร์การจัดการสถานะฝั่งเซิร์ฟเวอร์ได้โดยใช้ previous_interaction_id คุณเลือกใช้ลักษณะการทำงานแบบไม่เก็บสถานะได้โดยตั้งค่า store=false ดูรายละเอียดได้ในส่วนการเก็บรักษาข้อมูล
เริ่มต้นใช้งาน
- ตั้งค่า Agent การเขียนโค้ด: เชื่อมต่อกับ Gemini Docs MCP และติดตั้ง
ทักษะ
gemini-interactions-apiเพื่อให้ Assistant เข้าถึง เอกสารประกอบสำหรับนักพัฒนาซอฟต์แวร์และแนวทางปฏิบัติแนะนำล่าสุดได้โดยตรง ตั้งค่า Agent การเขียนโค้ด → - ย้ายข้อมูลจาก
generateContent: หากมีการผสานรวมอยู่แล้ว ให้ทำตามคู่มือการย้ายข้อมูลเพื่อ เปลี่ยนไปใช้ Interactions API - เริ่มต้นใช้งาน: เริ่มต้นใช้งานในคู่มือเริ่มต้นใช้งาน Interactions API
คำแนะนำฟีเจอร์
สำรวจความสามารถเฉพาะของ Interactions API ผ่านคำแนะนำเหล่านี้ คุณสามารถใช้ปุ่มเปิด/ปิดในหน้าเว็บเหล่านี้เพื่อสลับระหว่าง generateContent กับ Interactions API
- การสร้างข้อความ
- การสร้างรูปภาพ
- การทำความเข้าใจรูปภาพ
- การทำความเข้าใจเสียง
- การทำความเข้าใจวิดีโอ
- การประมวลผลเอกสาร
- การเรียกฟังก์ชัน
- เอาต์พุตที่มีโครงสร้าง
- Deep Research Agent
- การอนุมานแบบยืดหยุ่น
- การอนุมานตามลำดับความสำคัญ
วิธีการทำงานของ Interactions API
Interactions API มุ่งเน้นไปที่ทรัพยากรหลักอย่าง Interaction Interaction แสดงถึงรอบการสนทนาหรือรอบการทำงานที่สมบูรณ์ โดยทำหน้าที่เป็นบันทึกเซสชันที่มีประวัติการโต้ตอบทั้งหมดเป็นลำดับขั้นตอนการดำเนินการ ตามลำดับเวลา ขั้นตอนเหล่านี้รวมถึงความคิดของโมเดล การเรียกใช้เครื่องมือฝั่งเซิร์ฟเวอร์หรือฝั่งไคลเอ็นต์และผลลัพธ์ (เช่น function_call และ function_result) รวมถึง model_output สุดท้าย ทรัพยากรที่จัดเก็บไว้ (ดึงข้อมูลผ่าน interactions.get) ยังรวมถึงขั้นตอน user_input สำหรับบริบททั้งหมดด้วย แม้ว่าการตอบกลับ interactions.create จะแสดงเฉพาะขั้นตอนที่โมเดลสร้างขึ้น
เมื่อเรียกใช้
interactions.create คุณกำลัง
สร้างทรัพยากร Interaction ใหม่
การจัดการสถานะฝั่งเซิร์ฟเวอร์
คุณสามารถใช้ id ของการโต้ตอบที่เสร็จสมบูรณ์ในการเรียกใช้ครั้งถัดไปโดยใช้
previous_interaction_id พารามิเตอร์เพื่อสนทนาต่อ เซิร์ฟเวอร์จะใช้รหัสนี้เพื่อดึงข้อมูลประวัติการสนทนา ซึ่งช่วยให้คุณไม่ต้องส่งประวัติการแชททั้งหมดอีกครั้ง
พารามิเตอร์ previous_interaction_id จะเก็บเฉพาะประวัติการสนทนา (อินพุตและเอาต์พุต) โดยใช้ previous_interaction_id ส่วนพารามิเตอร์อื่นๆ จะมีขอบเขตการโต้ตอบ และใช้ได้กับการโต้ตอบเฉพาะที่คุณกำลังสร้างเท่านั้น ดังนี้
toolssystem_instructiongeneration_config(รวมถึงthinking_level,temperatureและอื่นๆ)
ซึ่งหมายความว่าคุณต้องระบุพารามิเตอร์เหล่านี้อีกครั้งในการโต้ตอบใหม่แต่ละครั้งหากต้องการให้พารามิเตอร์มีผล การจัดการสถานะฝั่งเซิร์ฟเวอร์นี้เป็นตัวเลือก คุณยังดำเนินการในโหมดไม่เก็บสถานะได้ด้วยการส่งประวัติการสนทนาทั้งหมดในคำขอแต่ละรายการ
การจัดเก็บและการเก็บรักษาข้อมูล
โดยค่าเริ่มต้น API จะจัดเก็บออบเจ็กต์ Interaction ทั้งหมด (store=true) เพื่อให้การใช้ฟีเจอร์การจัดการสถานะฝั่งเซิร์ฟเวอร์ (ด้วย previous_interaction_id) การดำเนินการเบื้องหลัง (โดยใช้ background=true) และวัตถุประสงค์ในการสังเกตการณ์ง่ายขึ้น
- แพ็กเกจแบบชำระเงิน: ระบบจะเก็บรักษาการโต้ตอบไว้เป็นเวลา 55 วัน
- รุ่นฟรี: ระบบจะเก็บรักษาการโต้ตอบไว้เป็นเวลา 1 วัน
หากไม่ต้องการให้เป็นเช่นนี้ คุณสามารถตั้งค่า store=false ในคำขอได้ การควบคุมนี้แยกจากการจัดการสถานะ คุณเลือกไม่จัดเก็บการโต้ตอบใดก็ได้ อย่างไรก็ตาม โปรดทราบว่า store=false เข้ากันไม่ได้กับ background=true และจะป้องกันไม่ให้ใช้ previous_interaction_id ในรอบถัดไป
คุณลบการโต้ตอบที่จัดเก็บไว้ได้ทุกเมื่อโดยใช้วิธีการลบที่พบใน ข้อมูลอ้างอิง API คุณจะลบการโต้ตอบได้ก็ต่อเมื่อทราบรหัสการโต้ตอบเท่านั้น
ระบบจะลบข้อมูลของคุณโดยอัตโนมัติหลังจากระยะเวลาการเก็บรักษาหมดลง
ระบบจะประมวลผลออบเจ็กต์ Interaction ตามข้อกำหนด
แนวทางปฏิบัติแนะนำ
- อัตราการเข้าถึงแคช: การใช้
previous_interaction_idเพื่อสนทนาต่อ ช่วยให้ระบบใช้การแคชโดยนัยสำหรับ ประวัติการสนทนาได้ง่ายขึ้น ซึ่งจะช่วยปรับปรุงประสิทธิภาพและลดต้นทุน - การโต้ตอบแบบผสม: คุณสามารถผสมและจับคู่การโต้ตอบของ Agent และ
โมเดลในการสนทนาได้ตามต้องการ ตัวอย่างเช่น คุณสามารถใช้ Agent เฉพาะทาง เช่น Deep Research Agent สำหรับการเก็บรวบรวมข้อมูลเบื้องต้น แล้วใช้โมเดล Gemini มาตรฐานสำหรับงานติดตามผล เช่น การสรุปหรือการจัดรูปแบบใหม่ โดยลิงก์ขั้นตอนเหล่านี้ด้วย
previous_interaction_id
โมเดลและ Agent ที่รองรับ
| ชื่อโมเดล | ประเภท | รหัสโมเดล |
|---|---|---|
| Gemini 3.1 Flash-Lite | โมเดล | gemini-3.1-flash-lite |
| Gemini 3.1 Flash-Lite (เวอร์ชันตัวอย่าง) | โมเดล | gemini-3.1-flash-lite-preview |
| Gemini 3.1 Pro (เวอร์ชันตัวอย่าง) | โมเดล | gemini-3.1-pro-preview |
| Gemini 3 Flash (เวอร์ชันตัวอย่าง) | โมเดล | gemini-3-flash-preview |
| Gemini 2.5 Pro | โมเดล | gemini-2.5-pro |
| Gemini 2.5 Flash | โมเดล | gemini-2.5-flash |
| Gemini 2.5 Flash-lite | โมเดล | gemini-2.5-flash-lite |
| Lyria 3 Clip (เวอร์ชันตัวอย่าง) | โมเดล | lyria-3-clip-preview |
| Lyria 3 Pro (เวอร์ชันตัวอย่าง) | โมเดล | lyria-3-pro-preview |
| Deep Research (เวอร์ชันตัวอย่าง) | Agent | deep-research-pro-preview-12-2025 |
| Deep Research (เวอร์ชันตัวอย่าง) | Agent | deep-research-preview-04-2026 |
| Deep Research (เวอร์ชันตัวอย่าง) | Agent | deep-research-max-preview-04-2026 |
| Antigravity (เวอร์ชันตัวอย่าง) | Agent | antigravity-preview-05-2026 |
SDK
คุณสามารถใช้ Google GenAI SDK เวอร์ชันล่าสุดเพื่อเข้าถึง Interactions API ได้
- ใน Python จะเป็นแพ็กเกจ
google-genaiตั้งแต่เวอร์ชัน1.55.0เป็นต้นไป - ใน JavaScript จะเป็นแพ็กเกจ
@google/genaiตั้งแต่เวอร์ชัน1.33.0เป็นต้นไป
ดูข้อมูลเพิ่มเติมเกี่ยวกับวิธีติดตั้ง SDK ได้ในหน้า ไลบรารี
ข้อจำกัด
- MCP ระยะไกล: Gemini 3 ไม่รองรับ MCP ระยะไกล ซึ่งจะพร้อมใช้งานเร็วๆ นี้
API
generateContent รองรับฟีเจอร์ต่อไปนี้ แต่ยังไม่พร้อมใช้งาน ใน Interactions API
- ข้อมูลเมตาวิดีโอ: ช่อง
video_metadataใช้เพื่อตั้งค่าช่วงการตัด และอัตราเฟรมที่กำหนดเองสำหรับการทำความเข้าใจวิดีโอ - Batch API
- การเรียกฟังก์ชันอัตโนมัติ (Python)
- การแคชอย่างชัดแจ้ง: โปรดทราบว่าการแคชโดยนัยฝั่งเซิร์ฟเวอร์พร้อมใช้งานใน Interactions API
ผ่าน
previous_interaction_id
ความคิดเห็น
ความคิดเห็นของคุณมีความสำคัญอย่างยิ่งต่อการพัฒนา Interactions API แชร์ความคิดเห็น รายงานข้อบกพร่อง หรือขอฟีเจอร์ใน ฟอรัมชุมชนนักพัฒนาแอป Google AI
ขั้นตอนถัดไป
- ลองใช้ Notebook เริ่มต้นอย่างรวดเร็วของ Interactions API
- ดูข้อมูลเพิ่มเติมเกี่ยวกับ Gemini Deep Research Agent