Tham gia các bản tin hàng ngày và hàng tuần của chúng tôi để có những cập nhật mới nhất và nội dung độc quyền về phạm vi phủ sóng AI hàng đầu trong ngành. Tìm hiểu thêm
Trí tuệ thông minhcông ty khởi nghiệp AI theo mô hình nền tảng đầu tiên của Singapore, đã tuyên bố kết thúc thành công vòng cấp vốn hạt giống, huy động được 22 triệu USD với mức định giá 200 triệu USD.
Được hỗ trợ bởi các nhà đầu tư nổi tiếng bao gồm Vertex Ventures, Sumitomo Group và JAFCO, công ty hy vọng sẽ tạo ra một con đường khác biệt trong phát triển AI, giải quyết những thiếu sót cơ bản trong các mô hình kiểu GPT.
“Thực sự, mục tiêu của công ty khởi nghiệp là tạo ra một thế hệ kiến trúc mô hình nền tảng mới để giải quyết các nhiệm vụ lý luận thực sự phức tạp và có thời gian dài, vốn thực sự là thách thức đối với các mô hình ngôn ngữ lớn (LLM), đặc biệt là đối với kiến trúc GPT, để giải quyết,” đồng sáng lập và Giám đốc điều hành Austin Zheng cho biết trong một cuộc phỏng vấn gần đây với VentureBeat được thực hiện qua trò chuyện video.
Kiến trúc mới ngoài Transformers truyền thống
Các mô hình kiểu GPT truyền thống dựa vào tự thoái lui phương pháp tạo ra dự đoán bằng cách xây dựng tuần tự trên các kết quả đầu ra trước đó.
Mặc dù hiệu quả đối với các nhiệm vụ chung, cách tiếp cận này gặp khó khăn với việc lập luận nhiều bước và giải quyết vấn đề phức tạp.
Zheng giải thích: “Với các mô hình hiện tại, tất cả chúng đều được huấn luyện bằng phương pháp tự hồi quy và nhờ đó, lợi ích là mô hình sẽ dễ dàng hội tụ vào nhiệm vụ chung hơn”. “Vì vậy, nó nghe có vẻ rất thông minh, vì vậy nó có thể giải quyết được rất nhiều nhiệm vụ khác nhau. Nó có khả năng khái quát hóa thực sự tốt, nhưng thực sự rất khó để họ giải quyết những nhiệm vụ phụ, phức tạp và dài, gồm nhiều bước. Và đó chính là lúc ảo giác xuất hiện,” Zheng nói.
Câu trả lời của Sapient là một kiến trúc mô hình mới lấy cảm hứng từ khoa học thần kinh và toán học, kết hợp các thành phần máy biến áp với cấu trúc mạng lưới thần kinh tái phát và mô phỏng cách thức hoạt động của bộ não con người.
“Mô hình sẽ luôn đánh giá giải pháp, đánh giá các phương án và đưa ra cho mình một mô hình phần thưởng dựa trên đó”, Zheng nói. “Và mô hình cũng có thể liên tục tính toán lặp đi lặp lại một điều gì đó cho đến khi tìm được giải pháp chính xác. Cùng với đó, đại lý của chúng tôi sẽ có thể triển khai đến một môi trường trong môi trường doanh nghiệp hoặc sản xuất, đồng thời liên tục học hỏi và cải thiện bản thân bằng cách thử và sai, đồng thời học cách trở thành chuyên gia trên cơ sở mã hiện có.”
Thiết kế này củng cố tính linh hoạt và sức mạnh của các mô hình của Sapient, cho phép chúng giải quyết nhiều nhiệm vụ với độ chính xác và độ tin cậy.
Nó cũng đặt chúng vào thế đối đầu với các mô hình lý luận thế hệ mới từ OpenAI và dòng o1 của nócũng như đối thủ cạnh tranh khác của Trung Quốc.
Xuất sắc về điểm chuẩn và hơn thế nữa
Những đổi mới của công ty được phản ánh qua hiệu suất tiêu chuẩn.
“Tiêu chuẩn đầu tiên chúng tôi sử dụng thực ra là Sudoku,” Zheng nói với VentureBeat. “Hiện tại, mô hình của chúng tôi là mạng thần kinh hoạt động tốt nhất về mặt giải Sudoku trên thị trường— độ chính xác 95% mà không cần sử dụng các công cụ và dữ liệu trung gian.”
Theo Zheng, trong khi các mô hình hàng đầu khác cần đào tạo các bước trung gian để giải câu đố sắp xếp số phổ biến thì Sapient chỉ cung cấp cho mô hình các bảng Sudoko chưa hoàn chỉnh, các quy tắc và lời giải cuối cùng và phải tự suy ra cách giải chúng. thông qua việc thử và sai.
Tương tự, các mô hình của Sapient đã xuất sắc trong các nhiệm vụ như điều hướng hai chiều và giải quyết các vấn đề toán học phức tạp, luôn vượt trội so với các phương pháp cạnh tranh.
Đào tạo những mô hình này là một lĩnh vực khác mà Sapient tạo nên sự khác biệt. “Không giống như các mô hình truyền thống yêu cầu lượng lớn dữ liệu từng bước, chất lượng cao, cách tiếp cận của chúng tôi chỉ cần các cặp câu hỏi và câu trả lời. Điều này làm giảm đáng kể rào cản đối với việc đào tạo các mô hình phức tạp”, Zheng nói.
Bằng cách tận dụng dữ liệu tổng hợp, Sapient giảm sự phụ thuộc vào các tập dữ liệu được quản lý, tạo ra các quy trình đào tạo hiệu quả và có thể mở rộng.
Ứng dụng thực tế: từ mã đến robot
Trọng tâm ban đầu của Sapient là các ứng dụng trong thế giới thực, bắt đầu với mã hóa doanh nghiệp và robot.
Các đại lý mã hóa tự trị của nó nhằm mục đích cách mạng hóa cách các doanh nghiệp quản lý nhu cầu bảo trì và phát triển phần mềm của họ.
Công ty đã triển khai một tác nhân mã hóa AI tự động trong môi trường doanh nghiệp của Sumitomo để tìm hiểu cơ sở mã của công ty và cuối cùng là bắt đầu duy trì và đóng góp cho nó.
Sapient đặt mục tiêu cung cấp một dịch vụ tương tự cho các khách hàng doanh nghiệp khác, điều mà Zheng mô tả là “các nhân viên AI và kỹ sư phần mềm AI thông minh và phù hợp có thể giúp họ duy trì, cập nhật và cũng phát triển hệ thống công nghệ hiện có”.
Không giống Devin của nhận thứcđược hỗ trợ bởi GPT-4o, Sapent tin rằng các tác nhân AI mã hóa của nó sẽ có thể hoạt động tự chủ — mà không cần bất kỳ con người nào hướng dẫn quy trình hoặc khắc phục sự cố, ngoại trừ việc người giám sát kiểm tra công việc trước khi nó được đưa vào hoạt động.
Công ty cũng đang thúc đẩy AI thể hiện, thiết kế các mô hình cho phép robot tương tác, học hỏi và thích ứng trong thời gian thực.
“Chỉ có một số ít công ty khởi nghiệp làm việc dựa trên sự hiểu biết về môi trường, đồng thời lập kế hoạch cho các lựa chọn và nhiệm vụ cũng như hiểu loại nhiệm vụ nào có thể thực hiện được – cũng liên tục, cải thiện bản thân trong việc hiểu môi trường, hiểu vấn đề và hiểu các trường hợp sử dụng ”, Zheng chỉ ra. “Đây sẽ là trọng tâm chính của chúng tôi trong 1-2 năm tới.”
Một tầm nhìn toàn cầu
Sapient đang tạo nên sự khác biệt không chỉ thông qua công nghệ mà còn thông qua cách tiếp cận toàn cầu và toàn diện.
“Có rất ít công ty khởi nghiệp AI ở cấp độ mô hình nền tảng bên ngoài Trung Quốc thực sự do các nhà sáng lập châu Á lãnh đạo,” Zheng lưu ý. “Chúng tôi thực sự muốn định vị mình là một tổ chức quốc tế và định hướng nghiên cứu. Ngoài ra, chúng tôi muốn trở thành một trong số ít tổ chức nghiên cứu quốc tế do người châu Á lãnh đạo đầu tiên đang giải quyết những vấn đề thực sự rất thách thức và chúng tôi cũng đang thấy điều đó sắp thành hiện thực.”
Với văn phòng tại Singapore và kế hoạch cho Vùng Vịnh, công ty đang xây dựng một phòng thí nghiệm nghiên cứu AI để tập hợp những quan điểm và tài năng đa dạng.
Nhóm của nó phản ánh đặc tính này, bao gồm các nhà khoa học và kỹ sư từ các tổ chức hàng đầu như DeepMind, Anthropic và Microsoft AI.
Sự đa dạng này, kết hợp với mối quan hệ hợp tác chặt chẽ với các nhà đầu tư Nhật Bản như Tập đoàn Sumitomo, giúp Sapient trở thành người chơi độc nhất trong hệ sinh thái AI toàn cầu.
Hướng tới cá nhân và doanh nghiệp
Tầm nhìn dài hạn của Sapient là tham vọng, hướng tới công nghệ có thể áp dụng mang lại kết quả hữu ích như nhau cho các cá nhân và doanh nghiệp.
“Mục tiêu cuối cùng sẽ là xây dựng một tác nhân thực sự tổng quát có thể thực sự giải quyết công việc hàng ngày cho người dùng của chúng tôi — một ‘giải pháp toàn tác nhân’ cho trợ lý cá nhân và để giải quyết tất cả nhiệm vụ của bạn..đó là nơi chúng tôi đang hướng tới mục tiêu công nghệ cũng như hướng đi của mình,” Zheng nói.
Điều này bao gồm các sản phẩm hướng tới công chúng trong tương lai như tác nhân mã hóa tự động và trợ lý cá nhân có mục đích chung.
Hiện tại, Sapient đang tập trung vào việc cải tiến công nghệ và cung cấp các giải pháp cấp doanh nghiệp. Các mô hình định giá vẫn đang được khám phá nhưng có thể bao gồm phí cấp phép, phí đăng ký hoặc phí dựa trên nhiệm vụ gắn liền với việc hoàn thành thành công.
Khi Sapient mở rộng quy mô hoạt động và khả năng của mình, đây vẫn là một công ty đáng chú ý trong bối cảnh AI đang phát triển nhanh chóng.