Quản lý sản phẩm AI cao cấp của Google: 6 đại lý tiếp quản công việc hàng ngày của tôi, chưa đến 400 USD mỗi tháng, hoạt động 24/7

Sau khi đọc bài viết này, bạn sẽ hiểu cách xây dựng đội ngũ AI Agent hoạt động tự động trong khi ngủ.

bởi Shubham Saboo

Tổng hợp bởi: Deep Tide TechFlow

**Hướng dẫn thủy triều sâu:**Sáu đại lý trong vai trò của họ hoàn thành nghiên cứu, tạo nội dung, xem xét mã và sản xuất bản tin trong khi tác giả ngủ.

Tác giả tiết lộ đầy đủ cấu trúc tài liệu, chi phí thực tế, cạm bẫy bước lên và đề xuất hàng tuần, khiến nó trở thành một trong những hồ sơ thực hành AI Agent cá nhân có giá trị nhất hiện nay.

Toàn văn như sau:

Sáu Đặc vụ AI đảm nhận tất cả công việc của tôi trong khi tôi ngủ.

Không phải là bản demo. Không phải là một dự án cuối tuần.

Một đội ngũ thực sự làm việc suốt ngày đêm để đảm bảo rằng tôi không bao giờ bị bỏ lại phía sau. Nghiên cứu hoàn tất, nội dung được soạn thảo, mã được xem xét và bản tin đã sẵn sàng. Mỗi buổi sáng khi tôi mở Telegram, họ đã hoàn thành toàn bộ ca làm việc của mình.

Hôm qua tôi đã đăng một bài viết về đội ngũ Đại lý của mình. Câu hỏi số một là: “Làm thế quái nào để tôi xây dựng bộ này?” "

Bài viết này là câu trả lời. Đừng nói về lý thuyết, đừng vẽ sơ đồ. Cấu trúc tệp tôi thực sự sử dụng, phí tôi thực sự trả, những thất bại tôi thực sự gặp phải. Tất cả trong đó.

Sau khi đọc bài viết này, bạn sẽ hiểu cách xây dựng đội ngũ AI Agent hoạt động tự động trong khi ngủ.

Tại sao lại là nhóm, không phải công cụ

Chạy cả kho lưu trữ Unwind AI và Awesome LLM Apps có nghĩa là làm sáu việc mỗi ngày: nghiên cứu những phát triển nóng trong không gian AI, viết tweet, viết bài đăng trên LinkedIn, soạn thảo bản tin, xem xét các đóng góp của GitHub cho kho lưu trữ và xử lý các vấn đề cộng đồng.

30 đến 60 phút cho mỗi nhiệm vụ. Sáu nhiệm vụ. Cả ngày của tôi đã trôi qua, và tôi vẫn chưa bắt đầu làm bất kỳ công việc thực sự nào.

Tôi đã cố gắng giải quyết vấn đề này với một nhân viên duy nhất. Một lời nhắc khổng lồ đảm nhận việc nghiên cứu, viết và đánh giá, tất cả đều được bao gồm. Kết quả là, mọi thứ được thực hiện tầm thường. Bối cảnh lấp đầy và chất lượng giảm sút. Một đại lý không thể đảm nhận sáu công việc cùng một lúc.

Vì vậy, tôi đã thuê sáu Đặc vụ AI.

Gặp gỡ đội ngũ

Mỗi Đặc vụ được đặt theo tên của một nhân vật trong phim truyền hình. Đây không phải là một mánh lới quảng cáo. Khi tôi nói với Claude, “Bạn có năng lượng của Dwight Schrute”, nó đã biết ý nghĩa của nó từ dữ liệu đào tạo: kỹ lưỡng, tập trung và coi trọng công việc của bạn. Đây là 30 mùa tích lũy nhân vật và tôi đã sử dụng nó miễn phí.

  1. Monica (Tham mưu trưởng): Được đặt theo tên của Monica Geller. Cô ấy là nhân viên chính và là người tôi tương tác nhiều nhất trên Telegram. Cô điều phối những người khác, xử lý các quyết định chiến lược và giao nhiệm vụ cho các chuyên gia phù hợp. Cô ấy đã viết trong SOUL.md thật của mình: "Bạn là người đảm bảo mọi thứ được thực hiện đúng. "

  2. Dwight (Nghiên cứu): Được đặt theo tên của Dwight Schrute. Anh thực hiện quét nghiên cứu ba lần một ngày, kiểm tra X, Hacker News, GitHub Hot Lists, blog Google AI và các tài liệu nghiên cứu, đồng thời viết các báo cáo tình báo có cấu trúc cho tất cả các tác nhân khác sử dụng.

  3. Kelly (X / Twitter): Được đặt theo tên của Kelly Kapoor. Cô ấy đọc nghiên cứu của Dwight và viết một tweet nháp bằng giọng điệu của tôi, bao gồm các tweet riêng lẻ, chủ đề và tweet trích dẫn. Trong SOUL.md thực của mình, cô viết, "Bạn biết một cái gì đó sẽ phổ biến trước khi nó trở nên phổ biến. "

  4. Rachel (LinkedIn): Được đặt theo tên của Rachel Green. Nguồn thông tin tình báo cũng giống như Kelly, trên một nền tảng khác, trong một giọng điệu khác và từ góc độ lãnh đạo tư tưởng hơn là một bình luận nóng bỏng.

  5. Ross (Kỹ thuật): Được đặt theo tên của Ross Geller. Xử lý việc xem xét mã, sửa lỗi và triển khai kỹ thuật. Ông viết trong SOUL.md thực của mình: "Khi giải quyết một vấn đề, trước tiên hãy hiểu nó một cách thấu đáo. Đừng chỉ khắc phục các triệu chứng. "

  6. Pam (Bản tin): Được đặt theo tên của Pam Beesly. Sắp xếp nguồn cấp dữ liệu hàng ngày của Dwight thành bản tóm tắt bản tin.

Sáu đại lý, mỗi người một công việc, và không có sự mơ hồ trong phân công lao động.

Bây giờ chúng ta hãy nói về việc xây dựng

Tôi chạy mọi thứ trên Mac Mini M4 của mình. Nhưng tôi phải nói rõ: bạn không cần Mac Mini.

OpenClaw hỗ trợ macOS, Linux và Windows (thông qua WSL). Một máy tính xách tay thì có, một máy tính chơi game thì có, và một VPS với giá 5 đô la mỗi tháng thì có. Sự tiện lợi của Mac Mini là nó luôn được cấp nguồn, yên tĩnh và cực kỳ tiết kiệm năng lượng, nhưng không cần thiết.

Cấu hình của tôi: Mac Mini M4 cơ bản. Luôn kết nối với nguồn điện và mạng, không cần màn hình và tương tác hoàn toàn thông qua Telegram trên điện thoại của bạn.

Cài đặt OpenClaw

Nó chỉ mất hai dòng lệnh đầu cuối và mất chưa đầy năm phút.

Nếu bạn gặp sự cố, hãy tham khảo tài liệu OpenClaw.

Điều này bắt đầu cổng, quá trình nền giữ cho mọi thứ chạy. Nó quản lý các đại lý của bạn, chạy các tác vụ cron và xử lý tin nhắn Telegram. Tắt thiết bị đầu cuối và tác nhân vẫn hoạt động.

Cấu trúc không gian làm việc

Một phiên bản OpenClaw, nhiều tác nhân. Không phải sáu bộ cài đặt độc lập.

Cấu trúc thư mục thực tế của tôi như sau:

Monica sống trong thư mục gốc. Cô ấy là đặc vụ chính mà tôi nói chuyện trực tiếp. Các đặc vụ khác là các đặc vụ trẻ em mà cô ấy có thể ủy quyền hoặc điều hành độc lập theo lịch trình cron của riêng mình.

Bạn không cần phải xây dựng sáu đại lý ngay từ đầu. Tôi bắt đầu chỉ với Monica và dành vài tuần để tham gia cùng những người khác khi quy trình làm việc trở nên rõ ràng hơn.

SOUL.md là gì?

Mỗi Agent được xác định bởi một file: SOUL.md. Đây là danh tính, vai trò và hướng dẫn hoạt động của tổng đài viên, đồng thời là tệp quan trọng nhất trong toàn bộ hệ thống.

Ví dụ, SOUL.md của Dwight đại khái như sau:

Chú ý những gì tệp này làm. Nó không chỉ là nói “bạn là một tác nhân nghiên cứu”. Nó mang lại cho các đại lý cá tính, nguyên tắc rõ ràng, mối quan hệ rõ ràng với các đại lý khác và một tập hợp các khuôn khổ ra quyết định.

Điều tương tự cũng xảy ra với SOUL.md của Monica.

Tất cả các tác nhân đều có cùng một khuôn mẫu: bản sắc, vai trò, nguyên tắc, mối quan hệ, phong cách. Mỗi SOUL.md khoảng 40 đến 60 dòng, đủ ngắn để được ngữ cảnh hóa đầy đủ trong mỗi phiên và đủ chi tiết để tạo ra hành vi nhất quán.

Phối hợp nhiều nhân viên

Không có lệnh gọi API giữa các tác nhân, không có hàng đợi tin nhắn, không có khung điều phối.

Chỉ tài liệu.

Dwight đã hoàn thành nghiên cứu của mình và viết kết quả vào intel/DAILY-INTEL.md. Kelly thức dậy, đọc tài liệu và soạn thảo tweet cho phù hợp. Rachel đọc cùng một tài liệu và soạn thảo một bài đăng trên LinkedIn. Pam đọc nó, viết bản tin.

Cơ chế phối hợp là hệ thống văn bản.

SOUL.md của Dwight cho anh ấy biết chính xác nơi cần viết:

AGENTS.md của Kelly cho cô ấy biết chính xác nơi đọc nó:

Không có phần mềm trung gian, không có lớp tích hợp. Dwight viết một tệp, Kelly đọc một tệp và việc bàn giao là một tài liệu đánh dấu trên đĩa.

Nghe có vẻ quá đơn giản. Nó thực sự đơn giản. Đó là lý do tại sao nó có thể chạy qua. Các tệp không gặp sự cố, các tệp không có vấn đề xác thực, các tệp không cần phải xử lý điều chỉnh API, chúng ở đó.

Dữ liệu có cấu trúc được lưu trữ trong JSON và các bản tóm tắt mà con người có thể đọc được được lưu trữ dưới dạng đánh dấu. Tác nhân đọc markdown và JSON là nguồn tin cậy để loại bỏ trùng lặp và theo dõi lâu dài.

Hệ thống bộ nhớ

Đặc vụ thức dậy mỗi khi thức dậy mà không có ký ức về phiên cuối cùng và mỗi cuộc trò chuyện bắt đầu lại từ đầu. Đây là một tính năng, không phải là một khiếm khuyết. Nhưng điều này có nghĩa là ký ức phải rõ ràng.

Nó được chia thành hai lớp.

Nhật ký hàng ngày (bộ nhớ/YYYY-MM-DD.md): Bản ghi thô của mỗi phiên, bao gồm những gì đã xảy ra, những gì đã được soạn thảo và những phản hồi đã nhận được. Nhân viên viết liên tục suốt cả ngày.

Trí nhớ dài hạn (MEMORY.md): Thông tin chi tiết được trích xuất từ nhật ký hàng ngày, bao gồm các bài học kinh nghiệm, sở thích khám phá và các mẫu được chú ý.

Các AGENTS.md mà mỗi tổng đài viên tuân theo vào đầu mỗi phiên là: đọc SOUL.md trước, sau đó đọc USER.md, sau đó là các tệp bộ nhớ cho hôm nay và ngày hôm qua, và cuối cùng là MEMORY.md nếu đó là phiên chính.

Các tác nhân này phát triển theo thời gian. Không phải vì các mô hình đã được cải thiện, mà vì bối cảnh chúng tải đã trở nên phong phú hơn.

Kelly đã học phong cách viết của tôi mà không cần biểu tượng cảm xúc hoặc hashtag. Điều này bây giờ nằm trong ký ức của cô ấy, và nó sẽ được phản ánh trong mọi bản nháp trong tương lai, vì vậy tôi không cần phải nói lại. Dwight đã biết những câu chuyện nào vượt qua “bộ lọc Alex” (hồ sơ đối tượng mục tiêu của chúng tôi) và những câu chuyện nào nên bỏ qua, và điều đó vẫn còn trong trí nhớ của anh ấy.

Trong mỗi nhịp tim, nhân viên thường xuyên xem lại nhật ký hàng ngày để chắt lọc nội dung quan trọng thành MEMORY.md. Hồ sơ hàng ngày là hồ sơ gốc, MEMORY.md là trí tuệ tinh luyện.

Lên lịch

Nhân viên cần tự thức dậy. OpenClaw xử lý điều này với lập lịch cron tích hợp.

Lịch trình thực tế của tôi như sau:

Vấn đề trật tự. Dwight chạy trước vì mọi người khác đều dựa vào đầu ra của anh ấy. Kelly và Rachel chạy theo anh ta vì họ cần các tệp tình báo của anh ta tồn tại để soạn thảo nội dung.

Cơ chế tự phục hồi nhịp tim

Các tác vụ Cron đôi khi thất bại. Máy được khởi động lại, tác vụ bị tạm ngưng và mạng bị ngắt kết nối trong quá trình gọi API. Đây là cơ sở hạ tầng, cơ sở hạ tầng có chế độ lỗi.

HEARTBEAT.md tệp cung cấp một mạng lưới an toàn. Với mỗi nhịp tim, tác nhân chính xác minh rằng nhiệm vụ cron thực sự được thực hiện:

Nếu một tác vụ không thành công hoặc bỏ lỡ một cửa sổ, nhịp tim sẽ bắt và buộc phải chạy lại. Tự phục hồi mà không cần can thiệp thủ công.

Nhịp tim phù hợp để thực hiện nhiều lần kiểm tra hoặc nơi thời gian có thể trôi đi một chút. Cron phù hợp với lịch trình chính xác và các tác vụ cần được tách biệt với phiên chính.

Telegram như một giao diện tương tác

Không có bảng điều khiển, không có giao diện người dùng web, không có phụ trợ quản trị. Tôi đang nói chuyện với Đặc vụ trên Telegram.

Đây là một lựa chọn có chủ ý. Tôi không muốn đăng nhập vào bảng điều khiển, tôi không muốn mở ứng dụng web, điện thoại của tôi luôn ở bên cạnh, Telegram luôn bật và nhân viên hỗ trợ đang tìm thấy tôi ở nơi tôi đang ở.

OpenClaw hỗ trợ Telegram như một kênh. Sau khi kết nối trong quá trình thiết lập, nhân viên của bạn sẽ xuất hiện dưới dạng bot Telegram. Bạn gửi một tin nhắn, nó trả lời tin nhắn, nó gửi cho bạn một bản nháp và bạn phê duyệt hoặc phủ quyết nó. Nó giống như có một đồng nghiệp trong một ứng dụng nhắn tin.

Monica là đầu mối liên hệ chính của tôi, xử lý hầu hết các cuộc trò chuyện, giao nhiệm vụ cho người khác. Các đại lý khác liên hệ trực tiếp với tôi khi các nhiệm vụ cron của họ tạo ra thứ gì đó đáng để xem xét.

Buổi sáng điển hình của tôi: thức dậy, mở Telegram, Dwight đã gửi một bản tóm tắt nghiên cứu, Kelly có ba bản nháp tweet đang chờ phê duyệt và Rachel đã chuẩn bị sẵn một bài đăng trên LinkedIn. Tôi đã xem xét, đưa ra phản hồi, phê duyệt thông qua và toàn bộ quá trình là 10 phút cà phê.

Xây dựng nhân cách

Bạn không thiết kế được tính cách hoàn hảo ngay từ đầu. Bạn bắt đầu với một dàn ý sơ bộ trong SOUL.md, quan sát hành vi của nhân viên và sửa nó theo thời gian. Nó giống như quản lý người thật.

Tôi gọi đây là “dự án gợi ý sửa chữa”.

Bản nháp ban đầu của Kelly chứa đầy biểu tượng cảm xúc và dấu chấm than, và đó không phải là phong cách của tôi. Vì vậy, tôi đã đưa ra phản hồi: “Không có biểu tượng cảm xúc, không có hashtag, câu ngắn và mạnh mẽ.” "Cô ấy đã cập nhật trí nhớ của mình và sau một tuần, cô ấy đều đặn làm đúng. Dwight ban đầu ghi lại quá nhiều nhiễu, với mọi kho lưu trữ nóng, mọi bản cập nhật nhỏ. Tôi nói với anh ấy, “Không phải mọi thứ đều quan trọng, tôi cần tín hiệu, không phải tiếng ồn.” Ông đã cập nhật các nguyên tắc của mình, và bây giờ các báo cáo tình báo của ông đã tập trung và có thể hành động.

Phiên bản đầu tiên của bất kỳ Đặc vụ nào đều tầm thường, phiên bản thứ mười là tốt và phiên bản thứ ba mươi là xuất sắc. Bạn phải đánh bóng nhiều lần. Đặt tên với một nhân vật truyền hình mang lại cho người mẫu một đường cơ sở tính cách ngay lập tức - “năng lượng Dwight Schrute” có nghĩa là kỹ lưỡng, tập trung và không vô nghĩa. Nhưng tính cách thực sự xuất hiện sau nhiều tuần sửa chữa được lưu trữ trong các tệp ký ức.

Một gợi ý mà tôi đồng ý: cung cấp cho mỗi đại lý một chức danh công việc trần tục duy nhất và điều kiện dừng lại. Các ràng buộc làm cho nhân viên tốt hơn và vai trò càng cụ thể thì đầu ra càng tốt.

Bảo mật

An toàn nằm trong tay bạn. Cách tiếp cận của tôi rất đơn giản: Các đại lý có thế giới riêng của họ, không phải thế giới của tôi.

Mac Mini là máy tính của họ. Họ có tài khoản email riêng, khóa API của riêng họ, quyền truy cập hạn chế của riêng họ và không có gì trên máy đó được kết nối với tài khoản cá nhân của tôi.

Các khóa API cho các dịch vụ như Gemini, Eleven Labs, v.v. được yêu cầu cụ thể cho phiên bản OpenClaw này. Tôi có thể theo dõi việc sử dụng và cắt quyền truy cập trong vòng vài giây nếu tôi tìm thấy bất thường.

Tôi không bao giờ cấp cho nhân viên quyền truy cập vào tài khoản cá nhân của mình. Nếu tôi muốn họ xem email, tôi chuyển tiếp email đó cho họ. Nếu tôi cần họ xem xét tài liệu, tôi chia sẻ chúng trên Telegram. Họ chỉ nhìn thấy những gì tôi muốn họ thấy, không nhiều hơn một chút.

Đây cũng là nguyên tắc mà bạn sẽ đối xử với nhân viên mới. Bạn không cung cấp cho họ chìa khóa cho mọi thứ ngay từ ngày đầu tiên, bạn cung cấp cho họ không gian làm việc của riêng họ, thông tin đăng nhập của riêng họ và chia sẻ thông tin theo yêu cầu.

Sẽ có vấn đề ở đâu và cách khắc phục chúng

Đó không phải là phép thuật, đó là cơ sở hạ tầng, cơ sở hạ tầng sẽ thất bại.

Cổng gặp sự cố. Nó hiếm khi xảy ra, nhưng nó xảy ra. Phương pháp khắc phục: Thực hiện “khởi động lại cổng openclaw”. Hệ thống nhịp tim bắt các tác vụ cron lỗi thời và buộc chạy lại, vì vậy bạn không mất cả ngày làm việc.

Nhiệm vụ Cron bị bỏ lỡ cửa sổ. Ngủ đông máy, ngắt kết nối mạng, điều chỉnh API. Khắc phục: HEARTBEAT.md Chế độ tự phục hồi. Monica kiểm tra xem nhiệm vụ có thực sự được thực hiện với mỗi nhịp tim hay không và nếu bất kỳ nhiệm vụ nào không được cập nhật trong hơn 26 giờ, cô ấy buộc phải chạy lại.

Cửa sổ ngữ cảnh bị tràn. Nhân viên đọc quá nhiều tệp khi bắt đầu phiên và không có chỗ cho công việc thực tế. Khắc phục: Giữ SOUL.md ngắn (40 đến 60 dòng), giữ cho AGENTS.md tập trung, chỉ tải các tệp bộ nhớ của hôm nay và ngày hôm qua, tác nhân không cần phải đọc toàn bộ lịch sử mỗi lần.

Chất lượng đầu ra của đại lý giảm. Điều này xảy ra khi các tệp bộ nhớ trở nên lộn xộn hoặc mâu thuẫn. Khắc phục: Bảo trì bộ nhớ thường xuyên. Trong một nhịp tim, Đặc vụ xem lại nhật ký hàng ngày, chắt lọc nội dung thành các mục MEMORY.md sạch và xóa hoặc lưu trữ các tệp hàng ngày cũ.

Phối hợp xung đột. Hai nhân viên đang cố gắng cập nhật cùng một tệp. Giải pháp: Thiết kế luồng tệp là “một người viết, nhiều người đọc”. Dwight viết DAILY-INTEL.md, mọi người khác đọc, và không ai khác viết cho nó.

Bài học về độ tin cậy lớn nhất: bắt đầu đơn giản. Một đại lý, một công việc, một điều phối viên. Để nó chạy đều đặn trong một tuần, sau đó thêm cái thứ hai. Những người triển khai sáu tác nhân vào ngày đầu tiên và tự hỏi tại sao có điều gì đó không ổn sẽ mắc sai lầm tương tự như triển khai một hệ thống phân tán mà không giám sát.

Chi phí thực sự

Phần cứng: Mac Mini M4 bắt đầu từ 499 đô la cho một chiếc mới, nhưng bất kỳ máy tính nào luôn bật sẽ làm được, một máy tính xách tay cũ, VPS 5 đô la mỗi tháng, bất cứ thứ gì có trong tay.

Chi phí mô hình AI: Tôi sử dụng nhiều kết hợp mô hình trong nhóm của mình, Claude Opus và Sonnet cho hầu hết các tác vụ của nhân viên, Gemini cho quy trình làm việc cụ thể và tôi cũng đang thử nghiệm chạy các mô hình cục bộ thông qua Ollama để giảm chi phí hơn nữa.

Chi tiết như sau:

Claude (Gói tối đa): $ 200 mỗi tháng

API Gemini: $ 50 đến $ 70 mỗi tháng

TinyFish (Web Agent): Khoảng $ 50 mỗi tháng

Eleven Labs (lồng tiếng): Khoảng $ 50 mỗi tháng

Telegram: Miễn phí

OpenClaw: Mã nguồn mở và miễn phí

Tổng cộng: Trong vòng 400 đô la mỗi tháng cho một đội không bao giờ nghỉ ngơi.

Điều gì đã thực sự thay đổi

Dwight giúp tôi tiết kiệm 2 đến 3 giờ nghiên cứu mỗi ngày. Tôi đã từng cuộn thủ công qua X, Hacker News, GitHub Hot Lists và blog AI mỗi sáng, nhưng bây giờ tôi thức dậy với một bản tóm tắt ưu tiên với liên kết đến các mục nguồn và hành động.

Kelly, Pam và Rachel đã tiết kiệm thêm 1 đến 2 giờ soạn thảo nội dung. Ross xử lý các nhiệm vụ kỹ thuật mà tôi sẽ thực hiện vào buổi tối.

Tổng: Tiết kiệm khoảng 4 đến 5 giờ mỗi ngày.

Nhưng giá trị thực không phải trong một ngày, mà là sự liên tục của nhiều tuần và tháng. Một tác nhân thực hiện nghiên cứu mỗi ngày trong 30 ngày sẽ tích lũy một tập hợp các tín hiệu được theo dõi, quỹ đạo xu hướng và nhận dạng mẫu, không thể được tạo ra trong bất kỳ phiên nào. Tần suất đăng bài của tôi trên X đã tăng lên, chất lượng được cải thiện và thời gian đăng bài của tôi trở nên ổn định hơn. Kho lưu trữ Ứng dụng LLM tuyệt vời tiếp tục phát triển và bản tin có một quy trình nghiên cứu đáng tin cậy để giữ cho nó trôi chảy.

Những tác nhân này không thể thực hiện tư duy ban đầu, chuyển đổi chiến lược hoặc đột phá sáng tạo, họ xử lý công việc lặp đi lặp lại, có cấu trúc từng mất hàng giờ để hoàn thành, giải phóng đôi tay của tôi để làm những việc thực sự cần bộ não con người.

Cách bắt đầu

Đừng cố gắng xây dựng sáu đại lý ngay từ ngày đầu tiên.

Tuần 1: Một đại lý, một công việc. Cài đặt OpenClaw, viết SOUL.md đầu tiên của bạn bằng cách nói chuyện với nhân viên, chọn một trong những nhiệm vụ lặp đi lặp lại nhất của bạn mỗi ngày (nghiên cứu hoặc soạn thảo nội dung cho hầu hết mọi người), thiết lập Telegram, tạo tác vụ cron, xem nó chạy trong một tuần và khắc phục mọi vấn đề phát sinh.

Tuần 2: Thêm một cơ chế ghi nhớ và tiếp tục đánh bóng. Kết quả ban đầu của nhân viên của bạn sẽ ở mức tầm thường, điều này là bình thường. Đưa ra phản hồi, xem tệp bộ nhớ phát triển và điều chỉnh SOUL.md dựa trên những gì bạn thấy. Vào cuối tuần thứ hai, Đặc vụ sẽ tạo ra đầu ra thực sự hữu ích.

Tuần 3: Tham gia đặc vụ thứ hai. Bây giờ bạn cảm thấy cần thiết - tác nhân nghiên cứu đang tạo ra thông tin tình báo, nhưng bạn vẫn đang tweet thủ công từ nó, đã đến lúc có một tác nhân nội dung. Thiết lập một mẫu tệp được chia sẻ: tác nhân đầu tiên ghi, tác nhân thứ hai đọc và cơ chế điều phối là hệ thống tệp.

Tuần 4 và hơn thế nữa: Xây dựng theo thứ tự. Thêm nhân viên mới khi bạn cảm thấy bị kéo, không phải khi bạn cảm thấy “nên” thêm họ. Mỗi người nên giải quyết một vấn đề thực sự mà bạn gặp phải, không phải là bản demo, không phải bằng chứng khái niệm, mà là một khoảng trống thực sự trong quy trình làm việc của bạn.

Hãy coi nó như tuyển dụng. Bạn không thuê sáu nhân viên ngay từ ngày đầu tiên, bạn thuê một người để làm cho họ hiệu quả và sau đó thuê một người khác khi khối lượng công việc yêu cầu.

Thay đổi tư duy

Sau khi nhân viên của bạn hoạt động ổn định trong một tháng, điều gì đó sẽ thay đổi. Thay vì coi AI là một công cụ mà bạn chỉ bật khi cần, bạn bắt đầu nghĩ về nó như một nhóm luôn làm việc.

Tôi bắt đầu nói chào buổi sáng với Monica vào buổi sáng khi tôi mở Telegram và nói chúc ngủ ngon với nhóm trước khi tắt điện thoại. Nghe có vẻ lố bịch, nhưng sau một tháng tương tác hàng ngày, vòng phản hồi và quan sát chúng tiến triển, ranh giới giữa các tác nhân và con người bắt đầu mờ nhạt.

Mô hình là cấu hình cơ bản và mọi người đều có thể sử dụng Claude, GPT và Gemini. Alpha đến từ một hệ thống được xây dựng xung quanh một mô hình - SOUL.md tệp, cơ chế bộ nhớ, chiến lược lập lịch, mô hình phối hợp, phản hồi sửa sai lệch hàng tuần được lưu trữ trong tệp.

Hệ thống là của bạn và không ai có cùng tác nhân với bạn, cùng tệp bộ nhớ với bạn và tính cách bóng bẩy như bạn.

Và nó đang tăng lên mỗi ngày.

Mỗi lần quét nghiên cứu từ Dwight làm phong phú thêm trí nhớ của anh ấy, mỗi vòng phản hồi từ Kelly làm sắc nét bản nháp của cô ấy và mọi lỗi mà Ross sửa để giúp anh ấy nhận thức rõ hơn về cơ sở mã của bạn.

Đây là con hào thực sự. Nó không phải là một mô hình, nó là một hệ thống học hỏi.

Bắt đầu ngay hôm nay. Một đại lý, một công việc, một điều phối viên.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim