Cách sử dụng công nghệ mới để phát triển AI và giám sát mô hình: Trọng lượng và xu hướng của LLMOps.

W&B Weave sử dụng các kỹ thuật và hình ảnh hiện đại, giúp các nhà phát triển dễ dàng khám phá dữ liệu, đánh giá các mô hình và thử nghiệm các khối xây dựng ML một cách liền mạch.

Weights & Trends (Trọng lượng & Xu hướng) – Công ty khởi nghiệp tại San Francisco đã phát hành hai khả năng mới, Weights & Biases (W&B) Weave và W&B Production Monitoring, để hỗ trợ và giám sát các mô hình máy học (ML) người mẫu. Sự kiện Chuyển đổi 2023 diễn ra tại San Francisco vào ngày 11-12 tháng 7 đã có sự tham gia của các giám đốc điều hành hàng đầu để chia sẻ cách tích hợp và tối ưu hóa các khoản đầu tư vào trí tuệ nhân tạo để đạt được thành công. Weights & Trends đang mở rộng nền tảng AI của mình để cung cấp bộ công cụ trực quan hóa phát triển AI và hỗ trợ cho LLMOps với các công cụ giám sát sản xuất mới. Weights & Biases sử dụng W&B Weave để hiểu các mô hình và dữ liệu trong bối cảnh trải nghiệm giao diện người dùng (UI) trực quan và giúp phát triển trực quan hóa dữ liệu tương tác. Sự giám sát sản xuất có thể giúp các tổ chức theo dõi các chỉ số quan trọng cho LLM và xác định các sai lệch không mong muốn theo thời gian so với đường cơ sở. Weights & Trends đã phát hành hai khả năng mới được thiết kế để giúp các tổ chức xây dựng và giám sát dễ dàng hơn ML người mẫu và sử dụng nó hiệu quả trong sản xuất. #WeightsAndTrends #AI #LLMOps #SanFrancisco #W&BWeave #WBProductionMonitoring #Chuyểnđổi2023 #ML #giámsát #sảntrongthờithượng

Nguồn: https://venturebeat.com/ai/weights-biases-new-llmops-capabilities-ai-development-model-monitoring/

Tham gia cùng các giám đốc điều hành hàng đầu tại San Francisco vào ngày 11-12 tháng 7, để nghe cách các nhà lãnh đạo đang tích hợp và tối ưu hóa các khoản đầu tư AI để thành công. Tìm hiểu thêm


công ty khởi nghiệp San Francisco Trọng lượng & Xu hướng đang mở rộng nền tảng của mình ngày hôm nay với việc phát hành một cặp khả năng mới được thiết kế để giúp các tổ chức xây dựng và giám sát dễ dàng hơn máy học (ML) người mẫu.

Làm cho LLMOps dễ dàng hơn

Nền tảng của Weights & Biases bao gồm các công cụ giúp kích hoạt vòng đời phát triển AI/ML. Vào cuối tháng 4, công ty đã bổ sung công cụ mới để kích hoạt LLMOps, nghĩa là, các hoạt động của quy trình công việc để hỗ trợ và phát triển các mô hình ngôn ngữ lớn (LLM). Các bổ sung mới được công bố hôm nay, W&B Weave và W&B Production Monitoring, nhằm mục đích giúp các tổ chức dễ dàng hơn để các mô hình AI chạy hiệu quả cho khối lượng công việc sản xuất.

Mặc dù Weave chỉ mới được công bố chính thức vào ngày hôm nay, nhưng các lần lặp lại ban đầu là một phần cốt lõi trong cách Weights & Biases xây dựng nền tảng tổng thể của mình để cung cấp bộ công cụ trực quan hóa phát triển AI.

“(Weave) là một phần rất lớn trong lộ trình của chúng tôi, đó là điều mà cá nhân tôi đã làm việc trong hai năm rưỡi nay,” Shawn Lewis, CTO kiêm đồng sáng lập của Weights & Biases, nói với VentureBeat. “Đó là nền tảng, vì vậy có rất nhiều thứ bạn có thể làm trên nền tảng này; đó là một công cụ để tùy chỉnh các công cụ của bạn cho miền vấn đề của bạn.”

Sự kiện

Chuyển đổi 2023

Hãy tham gia cùng chúng tôi tại San Francisco vào ngày 11-12 tháng 7, nơi các giám đốc điều hành hàng đầu sẽ chia sẻ cách họ đã tích hợp và tối ưu hóa các khoản đầu tư vào AI để đạt được thành công và tránh những cạm bẫy phổ biến.

Đăng ký ngay

AI không chỉ là về các mô hình, mà còn là trực quan hóa cách sử dụng chúng

Lewis giải thích rằng Weave ban đầu được hình thành như một công cụ để hiểu các mô hình và dữ liệu trong bối cảnh trải nghiệm giao diện người dùng (UI) trực quan, lặp đi lặp lại.

Anh ấy mô tả Weave là một bộ công cụ chứa các giao diện người dùng gốc có thể kết hợp được mà nhà phát triển có thể kết hợp để tạo ra một ứng dụng AI. Dệt cũng là về trải nghiệm người dùng; nó có thể giúp nhà khoa học dữ liệu phát triển trực quan hóa dữ liệu tương tác.

Lewis cho biết: “Weave là một bộ công cụ để kết hợp các giao diện người dùng với nhau, hy vọng theo cách cực kỳ trực quan đối với người dùng và kỹ sư phần mềm của chúng tôi làm việc với LLM. “Nó giúp chúng tôi đưa các công cụ ra thị trường trong nội bộ rất nhanh, vì chúng tôi có thể tạo ra trải nghiệm trực quan trên các loại dữ liệu mới một cách thực sự dễ dàng.”

Trên thực tế, Weave là công cụ mà Weights & Biases sử dụng nội bộ để phát triển các công cụ Prompts đã được công bố vào tháng Tư. Nó là nền tảng cho phép sử dụng các công cụ giám sát sản xuất mới.

W&B Weave sử dụng các kỹ thuật và hình ảnh hiện đại, giúp các nhà phát triển dễ dàng khám phá dữ liệu, đánh giá các mô hình và thử nghiệm các khối xây dựng ML một cách liền mạch.
W&B Weave sử dụng các kỹ thuật và hình ảnh hiện đại, giúp các nhà phát triển dễ dàng khám phá dữ liệu, đánh giá các mô hình và thử nghiệm các khối xây dựng ML một cách liền mạch. Tín dụng hình ảnh: Trọng số & Xu hướng

Dệt đang được cung cấp miễn phí dưới dạng mã nguồn mở Công cụ LLMOps, vì vậy bất kỳ ai cũng có thể sử dụng công cụ này để giúp xây dựng các công cụ AI. Nó cũng được tích hợp vào nền tảng Trọng số & Xu hướng để khách hàng doanh nghiệp có thể xây dựng trực quan hóa như một phần trong quy trình phát triển AI tổng thể của họ.

Xây dựng mô hình là một chuyện, giám sát nó lại là chuyện khác

Xây dựng và triển khai mô hình ML không phải là phần duy nhất của trí tuệ nhân tạo vòng đời. Theo dõi nó cũng rất quan trọng. Đó là nơi dịch vụ giám sát sản xuất của Weights & Biases phù hợp.

Lewis giải thích rằng dịch vụ giám sát sản xuất có thể tùy chỉnh để giúp các tổ chức theo dõi các chỉ số quan trọng đối với họ. Các số liệu chung cho bất kỳ hệ thống sản xuất nào thường là về tính khả dụng, độ trễ và hiệu suất. Với LLM cũng có một loạt các số liệu mới mà các tổ chức cần theo dõi. Do nhiều tổ chức sẽ sử dụng LLM của bên thứ ba sẽ tính phí dựa trên mức sử dụng nên điều quan trọng là phải theo dõi số lượng lệnh gọi API đang được thực hiện để quản lý chi phí.

Với các triển khai AI không phải LLM, vấn đề trôi dạt mô hình là mối quan tâm giám sát phổ biến, trong đó các tổ chức theo dõi để xác định các sai lệch không mong muốn theo thời gian so với đường cơ sở. Với LLM — nghĩa là sử dụng trí tuệ nhân tạo – không thể dễ dàng theo dõi sự trôi dạt của mô hình, Lewis nói.

Ví dụ: đối với một mô hình AI tổng quát được sử dụng để giúp viết các bài báo tốt hơn, sẽ không có một phép đo hoặc con số nào mà một tổ chức có thể sử dụng để xác định độ lệch hoặc chất lượng, Lewis nói.

Đó là nơi mà bản chất có thể tùy chỉnh của giám sát sản xuất xuất hiện. Trong ví dụ viết bài, một tổ chức có thể chọn theo dõi xem người dùng thực sự tích hợp bao nhiêu đề xuất do AI tạo ra và mất bao nhiêu thời gian để đạt được kết quả tốt nhất.

Giám sát sản xuất cho phép đo lường thời gian thực với hình ảnh trực quan phù hợp nhất và truy vấn động, linh hoạt cho trường hợp sử dụng cụ thể của tổ chức.
Giám sát sản xuất cho phép đo lường thời gian thực với hình ảnh trực quan phù hợp nhất và truy vấn động, linh hoạt cho trường hợp sử dụng cụ thể của tổ chức. Tín dụng hình ảnh: Trọng số & Xu hướng

Giám sát có khả năng có thể được sử dụng để trợ giúp với ảo giác AI. Một cách tiếp cận ngày càng phổ biến để hạn chế ảo giác là sử dụng thế hệ tăng cường truy xuất (RAG). Những kỹ thuật này cung cấp nguồn cho một phần cụ thể của nội dung được tạo. Lewis nói rằng một tổ chức có thể sử dụng giám sát sản xuất để đưa ra hình ảnh trực quan trong bảng điều khiển giám sát nhằm giúp hiểu rõ hơn.

Ông nói: “Có thể nó sẽ không cho bạn biết chắc chắn rằng ảo giác đã xảy ra, nhưng ít nhất nó sẽ cung cấp cho bạn tất cả thông tin cần thiết để xem xét nó và hình thành kiểu hiểu biết của con người về việc liệu điều đó có xảy ra hay không”.

Sứ mệnh của VentureBeat là trở thành một quảng trường thành phố kỹ thuật số để những người ra quyết định kỹ thuật có được kiến ​​thức về công nghệ doanh nghiệp chuyển đổi và giao dịch. Khám phá Briefings của chúng tôi.


[ad_2]

Leave a Reply

Your email address will not be published. Required fields are marked *