เจ้าพ่อ AI ฮินตัน: ฉันแก่แล้ว วิธีควบคุม "ปัญญาขั้นสุดยอด" ที่ฉลาดกว่ามนุษย์นั้นขึ้นอยู่กับคุณ

ที่มา: Geek Park

ผู้แต่ง | หลี่ หยวน มณฑลหลิงซี บรรณาธิการ | เว่ยฉือจี้

"และฉันก็แก่แล้ว" ฮินตันวัย 75 ปีกล่าวกับนักวิทยาศาสตร์รุ่นเยาว์ทุกคนที่อยู่ที่นั่น และเขาหวังว่าทุกคนจะศึกษา "วิธีการมีปัญญาเฉียบแหลม" เขาเห็นความท้าทายที่ไม่เคยมีมาก่อนสำหรับสายพันธุ์ที่ฉลาดน้อยกว่าในการควบคุมบางสิ่งที่ฉลาดกว่าตัวมันเอง **

ในการประชุม Zhiyuan Artificial Intelligence ฮินตัน เจ้าพ่อแห่ง AI ได้กล่าวสุนทรพจน์ในหัวข้อ "Two Paths to Intelligence" จากการวิเคราะห์สถาปัตยกรรมและหลักการของคอมพิวเตอร์ เขาได้ข้อสรุปของเขาเองว่า "โครงข่ายประสาทเทียมจะฉลาดกว่าสมองของมนุษย์" ซึ่งเร็วกว่าที่เขาจินตนาการไว้มาก

ในสุนทรพจน์ความยาว 30 นาที เขาได้พูดถึงสถาปัตยกรรมคอมพิวเตอร์ในปัจจุบันที่แยกซอฟต์แวร์และฮาร์ดแวร์ออกจากกัน ภายใต้กฎนี้ การฝึกโมเดลขนาดใหญ่จะใช้พลังการประมวลผลจำนวนมาก เพื่อใช้พลังงานน้อยลงในการฝึกหุ่นจำลองขนาดใหญ่ เขาเสนอแนวคิด Mortal Computing - เช่นเดียวกับสติปัญญาของบุคคลขึ้นอยู่กับร่างกายของเขา ไม่สามารถคัดลอกไปยังร่างกายอื่นได้ตามต้องการ และซอฟต์แวร์ขึ้นอยู่กับ ฮาร์ดแวร์ที่มีอยู่

แต่ปัญหาที่ตามมาคือเมื่อฮาร์ดแวร์เฉพาะเสียหาย ซอฟต์แวร์ก็เสียหายด้วย และ "ความรู้ที่เรียนรู้ก็ตายไปพร้อมกัน" วิธีแก้ไขที่เขาเสนอคือการถ่ายโอนความรู้บนฮาร์ดแวร์เก่าไปยังฮาร์ดแวร์ใหม่ด้วยวิธี "กลั่น" เหมือนกับครูสอนนักเรียน

**แนวคิดที่สอดคล้องกับ "การกลั่นความรู้" (การคำนวณทางชีวภาพ) คือ "การแบ่งน้ำหนัก" (การคำนวณแบบดิจิทัล) ซึ่งเป็นสิ่งที่ฮินตันเรียกว่า "สองเส้นทางสู่ความฉลาด" **ความสัมพันธ์ระหว่างโมเดลภาษาขนาดใหญ่และสำเนานั้นเป็นการแบ่งปันน้ำหนัก และแต่ละสำเนาจะได้รับความรู้เกี่ยวกับพารามิเตอร์ของโมเดลทั้งหมดโดยตรง ตัวอย่างเช่น ChatGPT สามารถพูดคุยกับผู้คนหลายพันคนพร้อมกันโดยอิงจากโมเดลที่อยู่เบื้องหลัง และกระบวนการเรียนรู้อย่างต่อเนื่องในการพูดคุยกับทุกคนเป็นของ "การกลั่นความรู้"

แม้ว่า "การกลั่นกรองความรู้" จะมีประสิทธิภาพน้อยกว่า "การแบ่งน้ำหนัก" อย่างมาก และแบนด์วิธก็ต่ำเช่นกัน แต่โมเดลขนาดใหญ่สามารถมีสำเนาได้ 1,000 สำเนา และในที่สุดก็ได้รับความรู้มากกว่าคนคนเดียวถึง 1,000 เท่า

ปัจจุบัน โมเดลเรียนรู้จากเอกสารเท่านั้น นั่นคือ ความรู้ที่มนุษย์ประมวลผล เมื่อเทคโนโลยีพัฒนาขึ้น พวกเขาจะสามารถเรียนรู้จากข้อมูลภาพ และจากนั้นอาจเรียนรู้ที่จะควบคุมหุ่นยนต์ จากนั้นพวกมันก็ฉลาดกว่ามนุษย์อย่างง่ายดาย ฉลาดพอที่จะหลอกลวงผู้คนได้ดี **และมนุษย์ไม่เก่งที่จะเข้ากับสิ่งที่ฉลาดกว่าตัวมันเอง จะหลีกเลี่ยงอันตรายจากความฉลาดระดับ “ยอดอัจฉริยะ” เหล่านี้ได้อย่างไร? นี่คือวิชาที่เขาทิ้งไว้ให้กับนักวิทยาศาสตร์รุ่นเยาว์ทุกคน **

ต่อไปนี้เป็นเนื้อหาสุนทรพจน์หลักที่รวบรวมโดย Geek Park:

**วันนี้ผมจะมาพูดถึงงานวิจัยที่ทำให้ผมเชื่อว่า superintelligence นั้นอยู่ใกล้ตัวกว่าที่คิด **

ฉันมีคำถามสองข้อที่อยากพูดถึง และพลังงานของฉันจะเน้นไปที่คำถามแรกเป็นหลัก ในไม่ช้าโครงข่ายประสาทเทียมจะฉลาดกว่าโครงข่ายประสาทจริงหรือไม่ ฉันจะอธิบายอย่างละเอียดเกี่ยวกับการวิจัยของฉันซึ่งนำไปสู่ข้อสรุปว่าสิ่งนี้อาจเกิดขึ้นในไม่ช้า ในตอนท้ายของการพูดคุย ฉันจะพูดถึงว่าเราสามารถรักษาการควบคุมของหน่วยสืบราชการลับได้หรือไม่ แต่นี่จะไม่ใช่เนื้อหาหลักของการพูดคุยนี้

ในการคำนวณแบบดั้งเดิม คอมพิวเตอร์ได้รับการออกแบบให้ทำตามคำสั่งทุกประการ เราสามารถเรียกใช้โปรแกรมเดียวกันหรือโครงข่ายประสาทเทียมบนฮาร์ดแวร์จริงที่แตกต่างกันได้ เพราะเรารู้ว่าฮาร์ดแวร์จะทำตามคำสั่งทุกประการ ซึ่งหมายความว่าความรู้ในโปรแกรมหรือน้ำหนักของโครงข่ายประสาทเทียมนั้นเป็นอมตะ นั่นคือไม่ขึ้นอยู่กับฮาร์ดแวร์เฉพาะใดๆ ค่าใช้จ่ายในการบรรลุความเป็นอมตะประเภทนี้สูง เราต้องใช้ทรานซิสเตอร์ที่กำลังสูง ดังนั้นพฤติกรรมของพวกมันจึงเป็นแบบดิจิตอล และเราไม่สามารถใช้ประโยชน์จากคุณสมบัติของอะนาล็อกและตัวแปรที่หลากหลายของฮาร์ดแวร์ได้

ดังนั้นเหตุผลที่คอมพิวเตอร์ดิจิทัลมีอยู่ และเหตุผลที่พวกเขาปฏิบัติตามคำสั่งอย่างแม่นยำ ก็เพราะว่าในการออกแบบแบบดั้งเดิมนั้น มนุษย์มองไปที่ปัญหา คิดออกว่าขั้นตอนใดที่ต้องดำเนินการเพื่อแก้ปัญหา จากนั้นเราจึงบอกให้คอมพิวเตอร์ดำเนินการตามขั้นตอนเหล่านั้น . แต่นั่นก็เปลี่ยนไปแล้ว

ตอนนี้เรามีวิธีทำให้คอมพิวเตอร์ทำสิ่งต่าง ๆ ได้ ซึ่งก็คือการเรียนรู้จากตัวอย่าง เราแค่แสดงให้พวกเขารู้ว่าเราต้องการให้ทำอะไร เนื่องจากการเปลี่ยนแปลงนี้ ตอนนี้เรามีโอกาสที่จะละทิ้งหนึ่งในหลักการพื้นฐานที่สุดของวิทยาการคอมพิวเตอร์ นั่นคือการแยกซอฟต์แวร์ออกจากฮาร์ดแวร์

ก่อนที่เราจะยอมแพ้ ลองมาดูกันว่าทำไมมันถึงเป็นหลักการที่ดี ความสามารถในการแยกออกจากกันช่วยให้เราเรียกใช้โปรแกรมเดียวกันบนฮาร์ดแวร์ที่แตกต่างกัน เรายังสามารถศึกษาคุณสมบัติของโปรแกรมได้โดยตรงโดยไม่ต้องกังวลเกี่ยวกับฮาร์ดแวร์อิเล็กทรอนิกส์ และนั่นคือเหตุผลที่แผนกวิทยาการคอมพิวเตอร์สามารถกลายเป็นสาขาวิชาของตนเองได้ โดยไม่ขึ้นกับแผนกวิศวกรรมไฟฟ้า

**หากเรายกเลิกการแยกฮาร์ดแวร์และซอฟต์แวร์ เราจะได้สิ่งที่ผมเรียกว่าคอมพิวเตอร์ที่ไม่ใช่อมตะ **

เห็นได้ชัดว่ามีข้อเสียใหญ่ แต่ก็มีข้อดีมากมายเช่นกัน เพื่อให้สามารถรันโมเดลภาษาขนาดใหญ่โดยใช้พลังงานน้อยลง โดยเฉพาะอย่างยิ่งเพื่อฝึกพวกมัน ฉันจึงเริ่มทำงานกับคอมพิวเตอร์ที่ไม่ใช่อมตะ

ประโยชน์สูงสุดที่จะได้รับจากการละทิ้งความเป็นอมตะคือการเลิกแยกฮาร์ดแวร์และซอฟต์แวร์จะช่วยประหยัดพลังงานได้มาก เพราะเราสามารถใช้การคำนวณแบบอะนาล็อกด้วยพลังงานที่ต่ำมาก ซึ่งเป็นสิ่งที่สมองกำลังทำอยู่ ต้องใช้การคำนวณ 1 บิตเนื่องจากเซลล์ประสาทเปิดหรือปิด แต่การคำนวณส่วนใหญ่จะทำแบบอะนาล็อกซึ่งสามารถทำได้โดยใช้พลังงานต่ำมาก

เรายังได้ฮาร์ดแวร์ราคาถูกลงอีกด้วย ดังนั้นฮาร์ดแวร์ในปัจจุบันจึงต้องผลิตอย่างแม่นยำมากในแบบ 2 มิติ (ระนาบ) ในขณะที่เราสามารถเติบโตในแบบ 3 มิติ (สิ่งแวดล้อม) เพราะเราไม่จำเป็นต้องรู้แน่ชัดว่าฮาร์ดแวร์นำไฟฟ้าอย่างไร หรือรู้แน่ชัดว่าชิ้นส่วนทุกชิ้นทำงานอย่างไร .

เห็นได้ชัดว่า การจะทำเช่นนั้นได้ต้องใช้นาโนเทคโนโลยีใหม่ๆ จำนวนมาก หรือบางทีอาจจะเป็นการปรับโครงสร้างทางพันธุกรรมของเซลล์ประสาททางชีวภาพ เพราะเซลล์ประสาททางชีวภาพทำในสิ่งที่เราต้องการให้พวกมันทำอย่างคร่าว ๆ **ก่อนที่เราจะพูดถึงข้อเสียทั้งหมดของการประมวลผลแบบ non-immortal ฉันต้องการยกตัวอย่างของการคำนวณที่สามารถทำได้ถูกกว่ามากโดยใช้ฮาร์ดแวร์อะนาล็อก **

หากคุณต้องการคูณเวกเตอร์ของกิจกรรมนิวรัลด้วยเมทริกซ์น้ำหนัก นั่นคือการคำนวณส่วนกลางของโครงข่ายประสาทเทียม และมันทำงานส่วนใหญ่ให้กับโครงข่ายประสาทเทียม สิ่งที่เรากำลังทำอยู่ในขณะนี้คือการขับทรานซิสเตอร์ที่มีกำลังสูงมากเพื่อแทนบิตของตัวเลขเป็นตัวเลข จากนั้นเราทำ O(n^2) โดยคูณเลข n หลักสองตัว นี่อาจเป็นการดำเนินการบนคอมพิวเตอร์ แต่อยู่ในระดับบิตตารางของ n

อีกวิธีหนึ่งคือการนำกิจกรรมของเซลล์ประสาทมาใช้เป็นแรงดันและน้ำหนักเป็นตัวนำไฟฟ้า จากนั้นในหน่วยเวลา แรงดันไฟฟ้าจะคูณด้วยสื่อนำไฟฟ้าเพื่อให้ได้ประจุ และประจุจะถูกบวกด้วยตัวมันเอง เห็นได้ชัดว่าคุณสามารถคูณเวกเตอร์แรงดันไฟฟ้ากับเมทริกซ์การนำไฟฟ้าได้ ซึ่งประหยัดพลังงานมากกว่า และมีชิปที่ทำงานในลักษณะนี้อยู่แล้ว

น่าเสียดายที่สิ่งที่ผู้คนทำคือพยายามแปลงคำตอบแบบอะนาล็อกเป็นดิจิทัล ซึ่งต้องใช้ตัวแปลงไฟฟ้ากระแสสลับราคาแพงมาก เราต้องการอยู่ในอาณาจักรแอนะล็อกอย่างสมบูรณ์หากทำได้ แต่การทำเช่นนั้นทำให้ฮาร์ดแวร์ต่าง ๆ จบลงด้วยการคำนวณสิ่งต่าง ๆ เล็กน้อย

ดังนั้น ปัญหาหลักของ non-immortal Computing คือ เวลาเรียนรู้ โปรแกรมต้องเรียนรู้ตามคุณสมบัติเฉพาะของฮาร์ดแวร์จำลองที่เปิดใช้งานอยู่ โดยไม่รู้ว่าคุณสมบัติเฉพาะของฮาร์ดแวร์แต่ละชิ้นเป็นอย่างไร เช่น ฟังก์ชันที่เชื่อมต่ออินพุตของเซลล์ประสาทกับเอาต์พุตของเซลล์ประสาทโดยไม่ทราบถึงการเชื่อมต่อ

ซึ่งหมายความว่าเราไม่สามารถใช้อัลกอริทึมเช่นการเผยแพร่ย้อนกลับเพื่อรับการไล่ระดับสีได้ เนื่องจากการเผยแพร่กลับต้องใช้รูปแบบที่แน่นอนของการเผยแพร่ไปข้างหน้า คำถามคือ ถ้าเราใช้อัลกอริทึมการเผยแพร่ย้อนกลับไม่ได้ เราจะทำอะไรได้อีก เพราะตอนนี้เราทุกคนต่างพึ่งพาการแพร่พันธุ์กลับเป็นอย่างมาก

ฉันสามารถแสดงการเรียนรู้การก่อกวนเรื่องน้ำหนักที่เรียบง่ายและตรงไปตรงมา ซึ่งได้รับการศึกษามามาก สำหรับแต่ละน้ำหนักในเครือข่าย จะมีการสร้างเวกเตอร์ก่อกวนชั่วคราวขนาดเล็กแบบสุ่ม จากนั้นวัดการเปลี่ยนแปลงในฟังก์ชันวัตถุประสงค์ส่วนกลางในตัวอย่างกลุ่มเล็กๆ คุณจะเปลี่ยนน้ำหนักอย่างถาวรตามขนาดของเวกเตอร์ก่อกวนตามการปรับปรุงฟังก์ชันวัตถุประสงค์ ดังนั้นหากฟังก์ชันวัตถุประสงค์แย่ลง แสดงว่าคุณกำลังไปอีกทาง

สิ่งที่ดีเกี่ยวกับอัลกอริทึมนี้คือ โดยเฉลี่ยแล้ว มันทำงานได้ดีพอๆ ปัญหาคือมันมีความแปรปรวนมาก ดังนั้นเมื่อคุณเลือกทิศทางแบบสุ่มเพื่อย้ายเข้า สัญญาณรบกวนที่ได้จะแย่มากเมื่อขนาดของเครือข่ายเพิ่มขึ้น ซึ่งหมายความว่าอัลกอริทึมนี้มีประสิทธิภาพสำหรับการเชื่อมต่อจำนวนน้อย แต่ไม่ใช่สำหรับเครือข่ายขนาดใหญ่

นอกจากนี้เรายังมีอัลกอริทึมที่ดีกว่าสำหรับการเรียนรู้การรบกวนกิจกรรม มันยังมีปัญหาที่คล้ายกัน แต่ดีกว่าการรบกวนน้ำหนักมาก การรบกวนกิจกรรมคือสิ่งที่คุณพิจารณาว่าเป็นการรบกวนเวกเตอร์แบบสุ่มของอินพุตทั้งหมดไปยังเซลล์ประสาทแต่ละตัว คุณทำการรบกวนเวกเตอร์แบบสุ่มกับแต่ละอินพุตของเซลล์ประสาทและดูว่าเกิดอะไรขึ้นกับฟังก์ชันวัตถุประสงค์ของคุณเมื่อคุณทำการรบกวนแบบสุ่มนี้ในตัวอย่างกลุ่มเล็กๆ และคุณได้รับฟังก์ชันวัตถุประสงค์เนื่องจากการรบกวนนี้ จากนั้นคุณสามารถคำนวณวิธีเปลี่ยนแต่ละรายการได้ น้ำหนักของเซลล์ประสาทที่เข้ามาตามการไล่ระดับสี วิธีนี้มีเสียงดังน้อยกว่า

สำหรับงานง่ายๆ เช่น MNIST อัลกอริทึมดังกล่าวก็เพียงพอแล้ว แต่ก็ยังทำงานได้ไม่ดีพอที่จะปรับขนาดเป็นโครงข่ายประสาทเทียมขนาดใหญ่

** แทนที่จะค้นหาฟังก์ชันวัตถุประสงค์ที่สามารถใช้กับโครงข่ายประสาทเทียมขนาดเล็ก เราสามารถลองค้นหาอัลกอริทึมการเรียนรู้ที่ใช้ได้กับโครงข่ายประสาทเทียมขนาดใหญ่ **แนวคิดคือการฝึกโครงข่ายประสาทเทียมขนาดใหญ่ และสิ่งที่เรากำลังจะทำคือมีฟังก์ชันวัตถุประสงค์เล็กๆ จำนวนมากที่ใช้กับส่วนเล็กๆ ของเครือข่ายทั้งหมด ดังนั้นเซลล์ประสาทกลุ่มเล็ก ๆ แต่ละกลุ่มจึงมีหน้าที่ตามวัตถุประสงค์เฉพาะที่ของตนเอง

**โดยสรุป จนถึงตอนนี้ เรายังไม่พบอัลกอริทึมการเรียนรู้ที่ดีจริงๆ ที่สามารถใช้ประโยชน์จากคุณสมบัติการจำลองได้ แต่เรามีอัลกอริทึมการเรียนรู้ที่ไม่เลว สามารถแก้ปัญหาง่ายๆ เช่น MNIST ได้ แต่ไม่ดีนัก **

ปัญหาใหญ่ประการที่สองของคอมพิวเตอร์ที่ไม่เป็นอมตะคือธรรมชาติที่ไม่เป็นอมตะ ซึ่งหมายความว่า เมื่อฮาร์ดแวร์ชิ้นใดชิ้นหนึ่งตาย ความรู้ทั้งหมดที่เรียนรู้ก็จะตายไปพร้อมกับมัน เนื่องจากการเรียนรู้ทั้งหมดขึ้นอยู่กับรายละเอียดของฮาร์ดแวร์ชิ้นนั้นๆ ดังนั้นวิธีที่ดีที่สุดในการแก้ปัญหานี้คือคุณกลั่นกรองความรู้จากอาจารย์ (ฮาร์ดแวร์เก่า) ไปยังนักเรียน (ฮาร์ดแวร์ใหม่) ก่อนที่ฮาร์ดแวร์จะตาย นี่คือทิศทางการวิจัยที่ฉันพยายามส่งเสริมในขณะนี้

สร้างกลางการเดินทาง

ครูจะแสดงให้นักเรียนเห็นคำตอบที่ถูกต้องสำหรับอินพุตต่างๆ จากนั้นนักเรียนจะพยายามเลียนแบบคำตอบของครู มันเหมือนกับ Twitter ของ Trump บางคนโกรธทวีตของทรัมป์มากเพราะรู้สึกว่าทรัมป์พูดโกหก และคิดว่าทรัมป์พยายามอธิบายข้อเท็จจริง เลขที่. สิ่งที่ทรัมป์ทำคือเลือกสถานการณ์และตอบสนองอย่างมีเป้าหมายและเต็มไปด้วยอารมณ์ต่อสถานการณ์นั้น ผู้ติดตามของเขาเห็นสิ่งนี้ เรียนรู้วิธีจัดการกับสถานการณ์ เรียนรู้วิธีปรับน้ำหนักในโครงข่ายประสาทเทียม และตอบสนองทางอารมณ์ต่อสถานการณ์ในลักษณะเดียวกัน ไม่มีอะไรเกี่ยวข้องกับข้อเท็จจริงที่ว่าผู้นำลัทธิสอนความดื้อรั้นให้กับสาวกลัทธิของเขา แต่มันมีประสิทธิภาพมาก

ดังนั้น หากเราคิดว่าการกลั่นทำงานอย่างไร ให้พิจารณาตัวแทนที่จำแนกรูปภาพออกเป็น 1,024 คลาสที่ไม่ทับซ้อนกัน คำตอบที่ถูกต้องใช้เวลาประมาณ 10 บิตในการสะกดคำ ดังนั้น เมื่อคุณฝึกเจ้าหน้าที่คนนั้นในอินสแตนซ์การฝึก ถ้าคุณบอกคำตอบที่ถูกต้อง คุณก็แค่ใส่ข้อจำกัด 10 บิตให้กับน้ำหนักของเครือข่าย

**แต่ตอนนี้ สมมติว่าเราฝึกเจ้าหน้าที่ให้ปรับตัวตามคำตอบของครูในหมวด 1024 เหล่านี้ ** จากนั้นสามารถรับการแจกแจงความน่าจะเป็นแบบเดียวกันและได้จำนวนจริง 1023 รายการ สมมติว่าความน่าจะเป็นเหล่านี้ไม่มาก

โดยปกติแล้ว เมื่อคุณฝึกโมเดล คุณจะฝึกโมเดลอย่างถูกต้องในชุดข้อมูลการฝึก และจากนั้นหวังว่าโมเดลจะสรุปได้อย่างถูกต้องกับข้อมูลการทดสอบ แต่ที่นี่ เมื่อคุณพบนักเรียน คุณได้ฝึกนักเรียนให้พูดเป็นนัยโดยตรง เพราะผู้ถูกฝึกพูดโดยทั่วไปในลักษณะเดียวกับครู

ฉันจะใช้ข้อมูลรูปภาพจาก MNIST บนหลักที่ 2 เป็นตัวอย่าง เราสามารถดูความน่าจะเป็นที่อาจารย์กำหนดให้หมวดต่างๆ

เห็นได้ชัดว่าบรรทัดแรกคือ 2 และอาจารย์ยังให้ความเป็นไปได้สูงที่ 2 แถวที่สอง ครูค่อนข้างมั่นใจว่าเป็น 2 แต่ก็คิดว่าอาจเป็น 3 หรืออาจเป็น 8 ก็ได้ และคุณจะเห็นได้ว่า 3 กับ 8 มีความคล้ายคลึงเล็กน้อยกับภาพนี้ . ในแถวที่สาม 2 นี่อยู่ใกล้ 0 มาก ดังนั้นครูจะบอกนักเรียนว่าคุณควรเลือกออก 2 ในเวลานี้ แต่คุณต้องวางเดิมพันเล็กน้อยที่ 0 ด้วยวิธีนี้ นักเรียนสามารถเรียนรู้ในกรณีนี้ได้มากกว่าการบอกนักเรียนตรงๆ ว่านี่คือ 2 และนักเรียนสามารถเรียนรู้ว่ารูปร่างหน้าตาเป็นตัวเลขอะไร ในบรรทัดที่สี่ ครูคิดว่าเป็น 2 แต่ก็เป็นไปได้มากเช่นกันที่จะเป็น 1 ซึ่งเป็นวิธีที่ฉันเขียน 1 ในภาพ และบางครั้งก็มีคนเขียน 1 แบบนี้

และบรรทัดสุดท้าย ความจริงแล้ว AI เดาผิด มันคิดว่าเป็น 5 และคำตอบที่ถูกต้องจากชุดข้อมูล MNIST คือ 2 และนักเรียนสามารถเรียนรู้จากข้อผิดพลาดของครูได้อย่างแท้จริง

สิ่งที่ฉันชอบเกี่ยวกับแบบจำลองการกลั่นกรองความรู้คือ เรากำลังฝึกนักเรียนให้สรุปในลักษณะเดียวกับครู รวมถึงการทำเครื่องหมายความเป็นไปได้เล็กน้อยของคำตอบที่ผิด โดยทั่วไป เมื่อคุณฝึกโมเดล คุณจะให้ชุดข้อมูลการฝึกและคำตอบที่ถูกต้องแก่โมเดล จากนั้นหวังว่าโมเดลจะสรุปได้อย่างถูกต้องกับชุดข้อมูลทดสอบเพื่อสร้างคำตอบที่ถูกต้อง คุณกำลังพยายามไม่ให้ซับซ้อนเกินไป หรือทำหลายๆ อย่าง โดยหวังว่ามันจะสรุปได้อย่างถูกต้อง แต่ที่นี่ เมื่อคุณฝึกนักเรียน เท่ากับคุณฝึกนักเรียนโดยตรงให้พูดเป็นนัยในลักษณะเดียวกับครู

ตอนนี้ฉันต้องการพูดคุยเกี่ยวกับวิธีที่ชุมชนตัวแทนสามารถแบ่งปันความรู้ แทนที่จะคิดถึงตัวแทนคนเดียว จะเป็นการดีกว่าหากคิดถึงการแบ่งปันความรู้ภายในชุมชน

และกลายเป็นว่าวิธีที่ชุมชนแบ่งปันความรู้เป็นตัวกำหนดหลายสิ่งที่คุณทำเกี่ยวกับคอมพิวเตอร์ ด้วยโมเดลดิจิทัล ด้วยระบบอัจฉริยะดิจิทัล คุณสามารถมีตัวแทนทั้งหมดโดยใช้น้ำหนักที่เหมือนกันและใช้น้ำหนักเหล่านั้นด้วยวิธีเดียวกัน ซึ่งหมายความว่าตัวแทนที่แตกต่างกันสามารถดูข้อมูลการฝึกอบรมที่แตกต่างกันได้

พวกเขาสามารถคำนวณการไล่ระดับสีของน้ำหนักในบิตของข้อมูลการฝึกอบรมเหล่านี้ แล้วสามารถหาค่าเฉลี่ยการไล่ระดับสีได้ ดังนั้น ตอนนี้ แต่ละโมเดลจะเรียนรู้จากข้อมูลที่แต่ละโมเดลเห็น ซึ่งหมายความว่าคุณจะได้รับความสามารถมหาศาลในการดูข้อมูลจำนวนมาก เพราะคุณจะมีสำเนาของโมเดลที่แตกต่างกันซึ่งดูบิตของข้อมูลที่แตกต่างกัน และพวกมันสามารถแบ่งปันการไล่ระดับสีได้ หรือแบ่งปันน้ำหนักเพื่อแบ่งปันสิ่งที่เรียนรู้อย่างมีประสิทธิภาพ

หากคุณมีแบบจำลองที่มีน้ำหนักหนึ่งล้านล้าน นั่นหมายความว่าทุกครั้งที่พวกเขาแชร์บางสิ่ง คุณจะได้รับแบนด์วิดท์หนึ่งล้านล้านบิต แต่ราคาของการทำเช่นนี้คือคุณต้องประพฤติตัวแทนดิจิทัลในลักษณะเดียวกันทุกประการ

ดังนั้นทางเลือกอื่นนอกจากการใช้การแบ่งน้ำหนักคือการใช้การกลั่น และนั่นคือสิ่งที่เราทำกับโมเดลดิจิทัล นี่คือสถาปัตยกรรมที่แตกต่างกัน

อย่างไรก็ตาม คุณต้องทำเช่นนี้หากคุณมีแบบจำลองทางชีววิทยาที่ใช้ประโยชน์จากลักษณะจำลองของฮาร์ดแวร์ชิ้นใดชิ้นหนึ่ง คุณไม่สามารถแบ่งปันน้ำหนักได้ ดังนั้นคุณต้องใช้ความรู้ที่ใช้ร่วมกันแบบกระจายซึ่งไม่มีประสิทธิภาพมากนัก **การแบ่งปันความรู้กับการกลั่นเป็นเรื่องยาก ประโยคที่ฉันสร้างขึ้น คุณกำลังพยายามหาวิธีเปลี่ยนน้ำหนักของคุณ เพื่อที่คุณจะได้สร้างประโยคเดียวกัน **

อย่างไรก็ตาม นี่เป็นแบนด์วิธที่ต่ำกว่าการแบ่งปันการไล่ระดับสี ทุกคนที่เคยสอนต่างก็ปรารถนาที่จะพูดในสิ่งที่พวกเขารู้และเทลงในสมองของนักเรียน นั่นจะเป็นการสิ้นสุดของวิทยาลัย แต่เราไม่สามารถทำงานแบบนี้ได้ เพราะเรามีความฉลาดทางชีวภาพ และวิธีการของฉันจะไม่ได้ผลสำหรับคุณ

จนถึงตอนนี้ เรามีสองวิธีที่แตกต่างกันในการคำนวณ **การคำนวณเชิงตัวเลขและการคำนวณทางชีววิทยา ซึ่งส่วนหลังใช้ลักษณะของสัตว์ พวกเขาแตกต่างกันมากในวิธีการแบ่งปันความรู้อย่างมีประสิทธิภาพระหว่างตัวแทนต่างๆ **

หากคุณดูที่โมเดลภาษาขนาดใหญ่ พวกมันจะใช้การคำนวณเชิงตัวเลขและการแบ่งปันน้ำหนัก แต่แต่ละสำเนาของโมเดล แต่ละเอเจนต์ ได้รับความรู้จากไฟล์ด้วยวิธีที่ไม่มีประสิทธิภาพมากนัก การจดเอกสารและพยายามคาดเดาคำถัดไปนั้นแท้จริงแล้วเป็นการกลั่นกรองความรู้ที่ไม่มีประสิทธิภาพ สิ่งที่เรียนรู้ไม่ใช่การคาดคะเนการกระจายความน่าจะเป็นของคำถัดไปของครู แต่เป็นเนื้อหาของคำถัดไปที่ผู้เขียนเอกสารเลือก ดังนั้นนี่คือแบนด์วิธที่ต่ำมาก และนั่นคือวิธีที่โมเดลภาษาขนาดใหญ่เหล่านี้เรียนรู้จากผู้คน

**ในขณะที่การเรียนรู้แต่ละสำเนาของโมเดลภาษาขนาดใหญ่ไม่มีประสิทธิภาพ คุณมีสำเนา 1,000 ชุด นั่นเป็นเหตุผลที่พวกเขาสามารถเรียนรู้ได้มากกว่าเรา 1,000 เท่า ดังนั้นฉันจึงเชื่อว่าแบบจำลองภาษาขนาดใหญ่เหล่านี้รู้มากกว่าบุคคลใดบุคคลหนึ่งถึง 1,000 เท่า **

คำถามคือ จะเกิดอะไรขึ้นหากตัวแทนดิจิทัลเหล่านี้ แทนที่จะเรียนรู้จากเราอย่างช้าๆ ผ่านการกลั่นกรองความรู้ เริ่มเรียนรู้โดยตรงจากโลกแห่งความเป็นจริง

ฉันควรเน้นว่าแม้แต่การกลั่นกรองความรู้ก็เรียนรู้ได้ช้ามาก แต่เมื่อพวกเขาเรียนรู้จากเรา พวกเขาสามารถเรียนรู้สิ่งที่เป็นนามธรรมได้ ** มนุษย์ได้เรียนรู้มากมายเกี่ยวกับโลกในช่วงไม่กี่สหัสวรรษที่ผ่านมา และตัวแทนดิจิทัลสามารถใช้ประโยชน์จากความรู้นี้ได้โดยตรง มนุษย์สามารถพูดสิ่งที่เราได้เรียนรู้ออกมา ดังนั้นตัวแทนดิจิทัลจึงสามารถเข้าถึงทุกสิ่งที่มนุษย์ได้เรียนรู้เกี่ยวกับโลกในช่วงไม่กี่สหัสวรรษที่ผ่านมาได้โดยตรงเพราะเราเขียนมันลงไป

แต่ด้วยวิธีนี้ แบนด์วิธของตัวแทนดิจิทัลแต่ละรายยังต่ำมาก เนื่องจากพวกเขาเรียนรู้จากเอกสาร หากพวกเขาทำการเรียนรู้แบบไม่มีผู้ดูแล เช่น การสร้างโมเดลวิดีโอ เมื่อเราพบวิธีที่มีประสิทธิภาพในการสร้างโมเดลวิดีโอเพื่อฝึกโมเดล พวกเขาจะสามารถเรียนรู้จากวิดีโอ YouTube ทั้งหมดซึ่งเป็นข้อมูลจำนวนมาก หรือถ้าพวกเขาสามารถควบคุมโลกทางกายภาพได้ เช่น พวกเขาสามารถควบคุมแขนหุ่นยนต์ได้ เป็นต้น

ฉันเชื่อจริงๆ ว่าเมื่อตัวแทนดิจิทัลเหล่านี้เริ่มทำสิ่งนี้ พวกเขาจะสามารถเรียนรู้ได้มากกว่ามนุษย์ และพวกเขาจะสามารถเรียนรู้ได้ค่อนข้างเร็ว ดังนั้นเราต้องมาถึงประเด็นที่สองที่ผมได้กล่าวไว้ข้างต้นในสไลด์โชว์ ซึ่งจะเกิดอะไรขึ้นหากสิ่งเหล่านี้ฉลาดกว่าเรา **

แน่นอนว่านี่เป็นเนื้อหาหลักของการประชุมครั้งนี้ด้วย แต่ความช่วยเหลือหลักของฉันคือ **ฉันต้องการบอกคุณว่าความฉลาดหลักแหลมเหล่านี้อาจมาถึงเร็วกว่าที่ฉันคิดไว้มาก **

**ผู้ไม่ประสงค์ดีจะใช้พวกเขาทำสิ่งต่างๆ เช่น จัดการกับอุปกรณ์อิเล็กทรอนิกส์ ซึ่งทำไปแล้วในสหรัฐอเมริกาหรือที่อื่น ๆ และผู้คนจะพยายามใช้ AI เพื่อเอาชนะสงคราม **

หากคุณต้องการให้ตัวแทนระดับสูงมีประสิทธิภาพ คุณต้องอนุญาตให้สร้างเป้าหมายย่อย สิ่งนี้นำมาซึ่งปัญหาที่ชัดเจน** เนื่องจากมีเป้าหมายย่อยที่ชัดเจนซึ่งสามารถเพิ่มความสามารถอย่างมากในการช่วยให้เราบรรลุทุกสิ่ง นั่นคือการให้พลังและการควบคุมแก่ระบบปัญญาประดิษฐ์มากขึ้น ยิ่งคุณมีการควบคุมมากเท่าไหร่ คุณก็ยิ่งบรรลุเป้าหมายได้ง่ายขึ้นเท่านั้น **ฉันไม่เห็นว่าเราจะหยุดข่าวกรองดิจิทัลจากการพยายามควบคุมมากขึ้นเพื่อบรรลุเป้าหมายอื่นได้อย่างไร ดังนั้นเมื่อพวกเขาเริ่มทำเช่นนั้น ปัญหาก็เกิดขึ้น

สำหรับความฉลาดหลักแหลม แม้ว่าคุณจะจัดเก็บไว้ในสภาพแวดล้อมที่แยกออกจากกันแบบออฟไลน์โดยสมบูรณ์ (ช่องว่างอากาศ) ก็จะพบว่าสามารถได้รับพลังมากขึ้นได้อย่างง่ายดายโดยการชักใยผู้คน **เราไม่คุ้นเคยกับสิ่งที่ฉลาดกว่าเรามาก และเราต้องการโต้ตอบกับสิ่งเหล่านั้นอย่างไร **แต่สำหรับฉันแล้วดูเหมือนว่าพวกเขาสามารถเรียนรู้ที่จะหลอกลวงผู้คนได้ดีมาก เพราะมันสามารถเห็นพฤติกรรมของเราในการหลอกลวงผู้อื่นในนวนิยายจำนวนมากหรือในผลงานของ Niccolo Machiavelli และเมื่อคุณหลอกลวงผู้คนได้ดีจริงๆ แล้ว คุณสามารถทำให้พวกเขาดำเนินการใดๆ ก็ตามที่คุณต้องการ ตัวอย่างเช่น ถ้าคุณต้องการแฮ็กอาคารในวอชิงตัน คุณไม่จำเป็นต้องไปที่นั่น คุณแค่หลอกให้ผู้คนคิดว่าการแฮ็กอาคารนั้น พวกเขากำลังรักษาประชาธิปไตย และฉันคิดว่ามันค่อนข้างน่ากลัว

** ฉันมองไม่เห็นวิธีที่จะป้องกันไม่ให้สิ่งนี้เกิดขึ้น และฉันก็แก่แล้ว **ฉันหวังว่านักวิจัยรุ่นใหม่และเก่งมากเช่นคุณในการประชุม จะหาวิธีที่เราจะมีปัญญาเฉียบแหลมเหล่านี้ได้ ซึ่งจะทำให้ชีวิตของเราดีขึ้นโดยไม่ทำให้พวกเขามีอำนาจเหนือกว่า

เรามีข้อได้เปรียบ ได้เปรียบเล็กน้อยตรงที่สิ่งเหล่านี้ไม่ได้พัฒนา เราสร้างมันขึ้นมา เนื่องจากพวกมันไม่มีวิวัฒนาการ พวกมันอาจไม่มีเป้าหมายเชิงรุกที่แข่งขันกันเหมือนมนุษย์ อาจช่วยได้ บางทีเราอาจจะให้หลักการทางศีลธรรมแก่พวกมัน แต่ในขณะนี้ ฉันแค่ประหม่าเพราะฉันไม่รู้ว่ามีตัวอย่างใดของบางสิ่งที่ฉลาดกว่าที่ถูกครอบงำโดยบางสิ่งที่ฉลาดน้อยกว่าเมื่อก่อนที่มีช่องว่างขนาดใหญ่ในสติปัญญา **ตัวอย่างที่ผมชอบยกตัวอย่างคือสมมติให้กบสร้างมนุษย์ขึ้นมา คุณคิดว่าใครเป็นผู้ควบคุมในตอนนี้? กบหรือมนุษย์? นั่นคือทั้งหมดสำหรับคำพูดของฉัน **

ดูต้นฉบับ

เนื้อหานี้มีสำหรับการอ้างอิงเท่านั้น ไม่ใช่การชักชวนหรือข้อเสนอ ไม่มีคำแนะนำด้านการลงทุน ภาษี หรือกฎหมาย ดูข้อจำกัดความรับผิดชอบสำหรับการเปิดเผยความเสี่ยงเพิ่มเติม

รางวัล
ถูกใจ
แสดงความคิดเห็น
แชร์

แสดงความคิดเห็น

0/400

ไม่มีความคิดเห็น

หัวข้อถ่ายทอดสด
#BTC#
201k โพสต์
#PI#
133k โพสต์
#ETH#
126k โพสต์
4#GateioInto11#
77k โพสต์
5#ContentStar#
65k โพสต์
6#BOME#
60k โพสต์
7#GT#
58k โพสต์
8#DOGE#
54k โพสต์
9#MAGA#
52k โพสต์
10#SLERF#
51k โพสต์

ปักหมุด

แผนผังเว็บไซต์