Hướng dẫn này sẽ giúp bạn phát triển một tác nhân AI chuyên biệt bằng Gaia. Trong ví dụ này, chúng tôi đang xây dựng một chatbot chuyên về dữ liệu Công thức 1 sẽ trả lời các câu hỏi xung quanh lịch sử, cuộc thi và quy định của nó. Hướng dẫn này sẽ chỉ cho bạn cách thiết lập một nút Gaia, xây dựng cơ sở kiến thức và khởi chạy một chatbot LLM tùy chỉnh. Đến cuối hướng dẫn này, chúng ta sẽ có một chatbot trực tiếp sẽ trả lời các câu hỏi về F1.
Gaia là gì?
Gaia là một cơ sở hạ tầng điện toán phi tập trung cho phép mọi người tạo, triển khai, mở rộng quy mô và kiếm tiền từ các tác nhân AI của riêng họ, phản ánh phong cách, giá trị, kiến thức và chuyên môn của họ. Nó cho phép các cá nhân và doanh nghiệp tạo ra các tác nhân AI.
Mỗi nút GaiaNet cung cấp:
một giao diện người dùng chatbot dựa trên web
một API tương thích với OpenAI
Cài đặt Gaia Node trên hệ thống của bạn
Trước khi bắt đầu xây dựng chatbot F1, trước tiên chúng ta phải cài đặt một nút trên hệ thống của bạn. Nút Gaia có thể được cài đặt trên nhiều thiết bị và hệ điều hành khác nhau. Để biết thêm thông tin, hãy xem Yêu cầu hệ thống.
Hãy nhanh chóng cài đặt một nút trên hệ thống của bạn.
Sử dụng thiết bị đầu cuối của bạn, chạy tập lệnh này để tải xuống phiên bản mới nhất của nút GaiaNet:
Sau khi chạy tập lệnh, bạn sẽ thấy thông tin sau trong terminal:
ID nút
Một lệnh sẽ làm cho công cụ GaiaNet CLI có sẵn trong shell
Một lệnh cho phép bạn khởi tạo nút.
Chạy lệnh sẽ làm cho công cụ CLI khả dụng, nó sẽ bắt đầu bằng nguồn.
Khởi tạo nút của bạn bằng cách sử dụng gaianet khởi tạo lệnh. Công cụ CLI sẽ giúp bạn tải xuống các mô hình và khôi phục các kiến thức nhúng.
Sau khi bạn đã khởi tạo nút, hãy bắt đầu nó bằng cách sử dụng gaianet bắt đầu yêu cầu.
Xin chúc mừng! Bạn đã cài đặt và khởi động nút GaiaNet! Bây giờ chúng ta đã hoàn tất bước đầu tiên, chúng ta có thể bắt đầu chuẩn bị chatbot F1 của mình.
Xây dựng cơ sở tri thức
Chuẩn bị dữ liệu F1
Nút Gaia của chúng tôi đã hoạt động, vì vậy bây giờ chúng tôi cần chuẩn bị dữ liệu F1. Việc chuẩn bị dữ liệu được thực hiện theo các bước sau:
Tổng hợp các nguồn dữ liệu
Tạo tệp .txt và thêm dữ liệu.
Phân đoạn dữ liệu
Trong hướng dẫn này, chúng tôi sẽ sử dụng các nguồn dữ liệu sau để đào tạo chatbot:
Tệp .txt của bạn phải được cấu trúc thành các phần rõ ràng, mỗi phần dưới 768 từ.
Ví dụ
Ví dụ sau đây minh họa cấu trúc của tệp .txt và cách định dạng tệp. Nếu tệp của bạn dưới 768 từ, thì bạn không cần ngắt dòng. Nếu tệp của bạn trên 768 từ, thì bạn sẽ cần ngắt dòng.
Giải đua xe Công thức 1 hay F1 hay Giải vô địch thế giới FIA là gì?Giải đua xe Công thức 1, thường được gọi là Công thức 1 hoặc F1, là hạng đua xe quốc tế cao nhất dành cho xe đua công thức một chỗ ngồi bánh hở được Liên đoàn ô tô quốc tế (FIA) công nhận. Giải đua xe Công thức 1 của FIA là một trong những hình thức đua xe hàng đầu thế giới kể từ khi ra mắt vào năm 1950. Từ công thức trong tên gọi đề cập đến bộ quy tắc mà tất cả xe của người tham gia phải tuân theo. Một mùa giải Công thức 1 bao gồm một loạt các cuộc đua, được gọi là Giải Grand Prix. Giải Grand Prix diễn ra ở nhiều quốc gia và châu lục trên các đường đua được xây dựng có mục đích hoặc đường công cộng khép kín. Một hệ thống tính điểm được sử dụng tại Giải Grand Prix để xác định hai Giải vô địch thế giới hàng năm: một cho các tay đua và một cho các nhà sản xuất (các đội đua). Giải đua xe Công thức 1 hay F1 hay Giải vô địch thế giới FIA là gì?Mỗi tài xế phải có Giấy phép Siêu cấp hợp lệ, loại giấy phép đua xe cao nhất do FIA cấp và các cuộc đua phải được tổ chức trên đường đua cấp một, loại xếp hạng cao nhất mà FIA cấp cho các đường đua. Xe Công thức 1 là xe đua đường trường được quản lý nhanh nhất thế giới, do tốc độ vào cua rất cao đạt được bằng cách tạo ra lực ép khí động học lớn. Phần lớn lực ép này được tạo ra bởi cánh trước và sau, có tác dụng phụ là gây ra nhiễu loạn nghiêm trọng phía sau mỗi xe. Sự nhiễu loạn làm giảm lực ép mà các xe theo sau tạo ra, khiến việc vượt xe trở nên khó khăn.Giải vô địch thế giới Công thức 1 hay F1 hoặc FIA là gì?Những thay đổi lớn được thực hiện đối với xe trong mùa giải 2022 đã dẫn đến việc sử dụng nhiều hơn khí động học hiệu ứng mặt đất và cánh được cải tiến để giảm nhiễu loạn phía sau xe, với mục tiêu giúp việc vượt xe dễ dàng hơn. Những chiếc xe phụ thuộc vào thiết bị điện tử, khí động học, hệ thống treo và lốp xe. Kiểm soát lực kéo, kiểm soát khởi động và chuyển số tự động, cùng các thiết bị hỗ trợ lái xe điện tử khác lần đầu tiên bị cấm vào năm 1994. Chúng được đưa trở lại trong thời gian ngắn vào năm 2001 và gần đây đã bị cấm lần lượt vào năm 2004 và 2008. Với chi phí trung bình hàng năm để điều hành một đội đua - thiết kế, chế tạo và bảo dưỡng ô tô, trả lương, vận chuyển - vào khoảng 220.000.000 bảng Anh (hoặc 265.000.000 đô la), các cuộc chiến tài chính và chính trị của Công thức 1 được đưa tin rộng rãi.Giải vô địch thế giới Công thức 1 hay F1 hay FIA là gì?Tập đoàn Công thức 1 thuộc sở hữu của Liberty Media, công ty đã mua lại tập đoàn này vào năm 2017 từ công ty cổ phần tư nhân CVC Capital Partners với giá 6,4 tỷ bảng Anh (8 tỷ đô la).
Xây dựng cơ sở kiến thức và mô hình nhúng của bạn
Bây giờ dữ liệu đã được tổng hợp, nó sẽ được chuyển đổi thành cơ sở dữ liệu vector. Đối với hướng dẫn này, chúng ta sẽ sử dụng công cụ GaiaNet được phát triển để tạo tệp ảnh chụp nhanh bộ sưu tập vector. Công cụ này giúp mọi người dễ dàng tạo cơ sở kiến thức của riêng mình.
Đầu tiên, bạn sẽ tải tệp .txt đã tạo trước đó vào công cụ bằng cách kéo tệp hoặc tải tệp lên.
Trong phần “snapshot_name”, hãy cung cấp tên cho ảnh chụp nhanh.
Tên ảnh chụp nhanh không được có bất kỳ ký tự đặc biệt hoặc khoảng trắng nào
Nhấp vào “Tạo RAG”, quá trình này có thể mất vài phút tùy thuộc vào kích thước tệp của bạn.
Sau khi RAG được tạo, phản hồi JSON sẽ được tạo và trông giống như thế này:
Xin chúc mừng, bạn đã tạo được RAG và chúng ta sẽ tiến hành cấu hình nút của bạn!
Cấu hình nút GaiaNet của bạn
Cho đến nay, chúng tôi đã cài đặt một nút trên hệ thống của mình, xây dựng cơ sở kiến thức và tạo RAG cho dữ liệu Công thức 1. Bây giờ chúng tôi phải cấu hình nút của mình để sử dụng cơ sở kiến thức F1.
Cập nhật mô hình LLM, chúng ta sẽ sử dụng mô hình có hiệu suất tốt hơn mặc định. Chạy mã này để cập nhật với Meta Llama 3.1-8B :
gaianet config \--snapshot https://huggingface.co/datasets/max-id/gaianet-qdrant-snapshot/resolve/main/formula1-b38b0f78-374b-44cc-a7ad-5157e7867760/formula1-b38b0f78-374b-44cc-a7ad-5157e7867760.snapshot \--embedding-url https://huggingface.co/gaianet/nomic-embed-text-gguf/resolve/main/nomic-embed-text-v1.5.f16.gguf \--embedding-ctx-size 8192 \--chat-url https://huggingface.co/gaianet/Meta-Llama-3.1-8B-Instruct-GGUF/resolve/main/Meta-Llama-3.1-8B-Instruct-Q5_K_M.gguf \--chat-ctx-size 8192 \--prompt-template llama-3-chat \--system-prompt "Bạn là chuyên gia về Công thức 1, có kiến thức sâu rộng về lịch sử đua xe, số liệu thống kê về tay đua và chiến lược của đội. Hãy trả lời ngắn gọn và chính xác các câu hỏi về F1. Hãy đặc biệt chú ý đến định dạng - sử dụng dấu đầu dòng, in đậm và ngắt dòng để văn bản dễ đọc hơn." \--rag-prompt "Đoạn văn sau là ngữ cảnh cho câu hỏi của người dùng. \n----------------\n"
Cập nhật những thay đổi về cấu hình:
gaianet initgaianet bắt đầu
Bây giờ nút của bạn đã được khởi động lại và cấu hình với dữ liệu Công thức 1, cuộc vui bắt đầu!
Kiểm tra đại lý F1 của bạn
Sử dụng URL nút được tạo khi nút của bạn được tạo lần đầu tiên để truy cập tác nhân và kiểm tra nó.