กริปเปอร์เรียนรู้ ... ผ่านการลองผิดลองถูก

Dec 26, 2019

แรงบันดาลใจจากมือมนุษย์ LearningGripper มีสี่นิ้ว ด้วยความช่วยเหลือจากซอฟแวร์การเรียนรู้ของเครื่องกริปเปอร์นี้สามารถควบคุมการกระทำที่ซับซ้อนเช่นการหยิบและการวางแนวบทความ ตำแหน่งพื้นฐานของนิ้วมือและฟังก์ชั่นข้อเสนอแนะจากสภาพแวดล้อมจะต้องมีการกำหนดไว้ล่วงหน้า กริปเปอร์เรียนรู้ลำดับการเคลื่อนที่อื่น ๆ ทั้งหมดโดยการลองผิดลองถูก

หน้าที่ของ LearningGripper ดังที่ได้อธิบายไว้คือเปลี่ยนลูกบอลจนกว่าโลโก้จะอยู่ด้านบน ที่จุดเริ่มต้นกริปเปอร์เคลื่อนลูกบอลแบบสุ่ม เซ็นเซอร์ตำแหน่งในลูกบอลให้คำติชมว่าโลโก้นั้นมาจาก“ ฝ่ามือ” ของ Gripper มากแค่ไหน LearningGripper ได้รับรางวัลตามระบบคะแนน คะแนนจะถูกประมวลผลในซอฟต์แวร์การเรียนรู้ของเครื่อง เมื่อเวลาผ่านไปซอฟต์แวร์พัฒนากลยุทธ์การเคลื่อนไหวและกริปเปอร์เรียนรู้ว่าจะต้องดำเนินการอย่างไร ณ จุดใดจุดหนึ่ง มันเปลี่ยนการเคลื่อนไหวของมันเพื่อรับการตอบรับเชิงบวกมากที่สุดเท่าที่จะทำได้และในที่สุดก็พบทางออกที่เชื่อถือได้สำหรับงานของมัน หากกลยุทธ์ของกริปเปอร์ตัวหนึ่งถูกถ่ายโอนไปยังอีกกริปเปอร์ตัวที่สองจะใช้สิ่งนั้นเป็นฐานความรู้เพื่อเรียนรู้กลยุทธ์ของตัวเองได้อย่างมีประสิทธิภาพมากขึ้น

LearningGripper แสดงให้เห็นว่าระบบในอนาคตจะสามารถแก้ไขงานที่สลับซับซ้อนได้อย่างอิสระโดยไม่ต้องเขียนโปรแกรมที่ซับซ้อน ระบบการเรียนรู้ด้วยตนเองเช่น LearningGripper สามารถติดตั้งในสายการผลิตแล้วอนุญาตให้ปรับพฤติกรรมของตนเองได้อย่างอิสระ