Đại học Nông nghiệp Nam Kinh (NAU) đã giới thiệu Sinong, mô hình ngôn ngữ lớn (LLM) chuyên sâu, mã nguồn mở đầu tiên của Trung Quốc dành riêng cho lĩnh vực nông nghiệp tổng hợp.
Theo báo Science and Technology Daily đưa tin ngày 13/1, việc ra mắt Sinong đánh dấu bước đột phá quan trọng trong nghiên cứu mô hình AI nền tảng và ứng dụng AI trong nông nghiệp tại Trung Quốc.
Mô hình được huấn luyện trên một bộ dữ liệu nông nghiệp lớn và có cấu trúc, bao phủ nhiều lĩnh vực chuyên sâu như khoa học chăn nuôi, kinh tế và quản lý nông nghiệp, tài nguyên và môi trường nông nghiệp, làm vườn, nông nghiệp thông minh, thú y, bảo vệ thực vật và chọn tạo giống cây trồng. Sinong đồng thời tích hợp nội dung từ gần 9.000 đầu sách, hơn 240.000 bài báo học thuật, khoảng 20.000 văn bản chính sách và tiêu chuẩn, cùng nguồn tri thức phong phú trên nền tảng Internet.

Thu hoạch bông trên cánh đồng ở Khu tự trị Duy Ngô Nhĩ Tân Cương, Tây Bắc Trung Quốc. Ảnh minh họa: THX/TTXVN
Để khắc phục những thách thức phổ biến của các mô hình ngôn ngữ chuyên ngành như tình trạng lỗi thời tri thức, vốn có thể dẫn tới việc tạo ra thông tin không chính xác, nhóm nghiên cứu đã triển khai các giải pháp kỹ thuật toàn diện.
Bên cạnh phương pháp tinh chỉnh theo chỉ dẫn thông thường, quá trình huấn luyện còn tích hợp dữ liệu đa chiều, trong đó có chuỗi lập luận (chain-of-thought) và tham chiếu ngữ cảnh, qua đó nâng cao đáng kể khả năng hiểu và tạo sinh tri thức nông nghiệp chuyên sâu của mô hình.
Hiện Sinong đã được mở mã nguồn hoàn toàn trên các nền tảng như ModelScope và GitHub. Theo NAU, chiến lược mã nguồn mở này nhằm giảm rào cản ứng dụng AI trong nông nghiệp, tạo điều kiện để những viện nghiên cứu, doanh nghiệp và cộng đồng phát triển tiếp tục khai thác Sinong cho phát triển và đổi mới thứ cấp, qua đó hình thành hệ sinh thái hợp tác cho các giải pháp nông nghiệp thông minh.