Gladia thu hút 16 triệu USD cho công nghệ chuyển văn bản và phân tích AI

Gladia uses AI for transcription.
Trong sự kiện ngày hôm nay, Gladia đã thu vốn $16 triệu cho dự án chuyển mã và phân tích trí tuệ nhân tạo. Tham gia bản tin hàng ngày và hàng tuần của chúng tôi để cập nhật thông tin mới nhất và nội dung độc quyền về thông tin hàng đầu về trí tuệ nhân tạo. #Gladia #AI #vnnews Gladia, một nhà cung cấp chuyển mã và trí thông minh âm thanh bằng trí tuệ nhân tạo, đã thu vốn $16 triệu. Công ty có trụ sở tại Paris, Pháp sẽ sử dụng nguồn vốn để phát triển cơ sở hạ tầng âm thanh toàn diện – bắt đầu với một hệ thống chuyển mã âm thanh và phân tích thời gian thực mới – cho phép các nền tảng truy cập qua giọng nói cung cấp nhiều giá trị hơn cho người dùng qua biên giới với trí tuệ nhân tạo tiên tiến. #innovation #technology Đó là một thách thức đối với các đối thủ như và, cũng như các dịch vụ dựa trên trí tuệ nhân tạo khác chuyển mã cuộc trò chuyện qua giọng nói thành văn bản. Trong một cuộc phỏng vấn với VentureBeat, CEO Jean-Louis Quéguiner đã giải thích vì sao ông đã bắt đầu công ty. #Frenchaccent #startuplife “Như bạn có thể nghe từ một phong cách phát âm Pháp đẹp, tôi không phải là người nói tiếng Anh và tôi rất nản lòng với những giọng điệu,” Quéguiner nói. “Đó là lý do tôi thành lập công ty.” Tôi đã được xem mẫu chuyển mã trí tuệ nhân tạo, và nó đã hoạt động trong thời gian thực khi Quéguiner nói tiếng Anh với giọng Pháp nặng của mình. Tôi quen với các dịch vụ như Otter có nhiều từ sai trong chuyển mã, nhưng trong trang kết quả đầu tiên từ Gladia, tôi không thấy lỗi nào. Ông cũng đã chỉ ra cách ông có thể nói hai ngôn ngữ khác nhau và hệ thống có thể chuyển đổi từ một ngôn ngữ sang ngôn ngữ khác khi cần thiết. #multilingual #realtime XAnge là đơn vị dẫn đầu vòng huy động vốn, với sự tham gia của Illuminate Financial, XTX Ventures, Athletico Ventures, Gaingels, Mana Ventures, Motier Ventures, Roosh Ventures và Soma Capital. #investment #funding Gladia sử dụng trí tuệ nhân tạo cho chuyển mã âm thanh. Được thành lập từ năm 2022, Gladia hiện đã thu vốn tổng cộng $20,3 triệu, với các khoản đầu tư hạ giống trước đó do New Wave, Sequoia Capital (như một phần của chương trình First Sequoia Arc), Cocoa và GFC dẫn đầu. Gladia gần đây đã được chọn tham gia chương trình tăng tốc trí tuệ nhân tạo tạo ra của AWS. #entrepreneur #startup “Ở Gladia, chúng tôi đánh giá cao những phẩm chất mà chúng tôi thích tôn vinh tại XAnge: một đội ngũ công nghệ toàn cầu dũ hiện đang ở phía trước về đổi mới của trí tuệ nhân tạo, với một mô hình kinh doanh đã được chứng minh để mở khóa cơ hội mới ở các ngành công nghiệp,” Alexis du Peloux, đối tác tại XAnge, nói trong một tuyên bố. “Trong một môi trường trí tuệ nhân tạo phức tạp và nhanh nhẹn, Jean-Louis Quéguiner và đội ngũ của mình đã thực hiện rất tốt, và chúng tôi hão hứng hỗ trợ Gladia cho chuỗi A.” Với hầu hết các mô hình nhận diện giọng nói hiện nay đều được đào tạo chủ yếu trên dữ liệu âm thanh tiếng Anh và do đó có thiên hướng thiên vị, Gladia ưu tiên xây dựng sản phẩm thời gian thực đầu tiên thực sự đa ngôn ngữ. #AI #language Bộ máy mới tinh chỉnh cung cấp chuyển mã thời gian thực tiên tiến trong hơn 100 ngôn ngữ, cùng với sự hỗ trợ nâng cao cho giọng điệu và khả năng duy nhất để thích ứng với các ngôn ngữ khác nhau ngay tại chỗ. #multilingual #technology Bộ máy mới của Gladia là độc đáo với khả năng trích xuất thông tin từ cuộc gọi – như tâm trạng của người gọi, thông tin chính và tổng kết cuộc trò chuyện – trong thời gian thực. Điều này có nghĩa là nó mất ít hơn một giây để hiển thị cả chuyển mã và thông tin từ cuộc gọi hoặc cuộc họp bằng cách sử dụng Gladia. #realtime #innovation What’s ahead Công ty sẽ sử dụng vốn mới để tiến xa hơn trong nỗ lực Nghiên cứu và Phát triển và sớm mang đến thị trường một bộ công cụ trí tuệ nhân tạo đa năng cho âm thanh và mở rộng ưu đãi sản phẩm của mình với các mô hình cá nhân bổ sung – bao gồm các mô hình ngôn ngữ lớn (LLMs) và hệ thống tạo khả năng truy xuất (RAG). Với một số đối tác thiết kế trong lĩnh vực dịch vụ Trung tâm cuộc gọi như một dịch vụ (CCaaS), công ty hiện đang thử nghiệm một giải pháp trợ giúp cho nhân viên bán hàng được cung cấp bởi bộ máy trí tuệ nhân tạo thời gian thực của Gladia. #future #R&D “Chúng tôi đa ngôn ngữ, và chúng tôi có cái gọi là ‘chuyển mã mã,’ điều này làm cho nó trở nên độc đáo,” Quéguiner nói. “Bạn có thể bắt đầu bằng ngôn ngữ và chuyển sang ngôn ngữ khác.” Ông tiếp tục cho tôi thấy rằng mình có thể bắt đầu một cuộc gọi bằng tiếng Anh và khởi đầu chuyển mã. Sau đó ông nói những từ tiếng Pháp, và mô hình dịch đúng trong tiếng Pháp. “Duy trì rằng (những người khác) hiện không phải là thực thời, và cái này là thời gian thực,” ông nói. “Thường thời gian thực sẽ không chính xác một chút. Bạn cũng có thể có từ vựng cá nhân của mình trong thời gian thực, điều mà khá hiếm với chúng tôi. Chúng tôi có khả năng trích xuất một số thông tin thời gian thực.” #AI #tech Dịch vụ này có một bộ tóm lược trí tuệ nhân tạo, và sẽ có các tính năng tùy chọn mới trong những tháng sắp tới. Quéguiner nói rằng dịch vụ của ông cũng có thể hiểu được các từ viết tắt và phát hiện chuyển sang ngôn ngữ khác. “Biến thể của mô hình mà chúng tôi sử dụng rất giống với các LLMs (các mô hình ngôn ngữ lớn). Nó không có kiến trúc bộ giải mã mã, điều mà không phải lúc nào cũng đúng trong trường hợp của hầu hết các mô hình mà bạn đã thấy với Fireflies, ví dụ. #language #AI Thị trường bao gồm “bộ ghi cuộc họp,” Quéguiner nói. Kết quả có thể được chuyển thành thông tin trí tuệ thời gian thực, có thể giúp mọi người như các cấp dẫn bán hàng đóng gói các thương vụ nhanh hơn. Công ty cũng làm việc với Trung tâm cuộc gọi, giúp họ tiết kiệm 30% thời gian hoàn thành nhanh hơn khi họ đang trên điện thoại nhờ vào độ chính xác cao hơn. Công ty sẽ tính giá phẳng như giá mỗi giờ. #customersupport #efficiency “Với Gladia, công ty đang bỏ vào thời gian và nguồn lực quý báu cố gắng tích hợp nhiều chức năng trí tuệ nhân tạo vào các nền tảng hiện có của họ,” Jonathan Soto, Giám đốc Công nghệ của Gladia, nói trong một tuyên bố. “API duy nhất của chúng tôi tương thích với tất cả các nền tảng công nghệ hiện có và giao thức, bao gồm SIP, VoIP, FreeSwitch, và Asterisk. Điều này cho phép chúng tôi dễ dàng tích hợp chuyển mã và phân tích thời gian thực vào các nền tảng trí tuệ nhân tạo của khách hàng, để họ có thể tập trung vào việc cung cấp dịch vụ tốt nhất cho người dùng cuối của mình.” #communication #technology #Gladia #trí tuệ nhân tạo #chuyển mã #phân tích #TI #hỗ trợ khách hàng #tiện lợi #tương lai #vốn đầu tư #sáng tạo #Công nghệ #cập nhật Nguồn:

Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More

Gladia, an AI transcription and audio intelligence provider, has raised $16 million in funding.

The Paris, France-based company will use the funding to develop an end-to-end audio infrastructure – starting with a new real-time audio transcription and analytics engine – enabling voice-first platforms to deliver more value to their users across borders with cutting-edge AI.

It’s a challenge to rivals such as and, as well as other AI-based services that transcribe voice conversations to text. In an interview with VentureBeat, CEO Jean-Louis Quéguiner explained to me why he started the company.

“As you can hear from a beautiful French accent, I’m not an English speaker and I was extremely frustrated with the accents,” Quéguiner said. “That’s why I founded the company.”

I got a demo of the AI transcription, and it worked in real time as Quéguiner spoke English with his heavy French accent. I’m used to services like Otter getting a lot of words wrong in a transcription, but in the first page of results from Gladia, I saw no errors. He also showed how he could speak two different languages and the system could shift from one language to another as needed.

XAnge led the round, with participation by Illuminate Financial, XTX Ventures, Athletico Ventures, Gaingels, Mana Ventures, Motier Ventures, Roosh Ventures, and Soma Capital.

Gladia uses AI for transcription.
Gladia uses AI for audio transcription.

Founded in 2022, Gladia has now raised a total of $20.3 million, with earlier seed investments headed by New Wave, Sequoia Capital (as part of the First Sequoia Arc program), Cocoa, and GFC. Gladia recently was selected to participate in the AWS generative AI accelerator program.

“Gladia represents the qualities we like to champion at XAnge: a bold, global tech team at the forefront of AI innovation, with a proven business model to unlock new opportunities across industries,” said Alexis du Peloux, partner at XAnge, in a statement. “In a fast-paced AI environment, Jean-Louis Quéguiner and his team have executed extremely well, and we are proud to back Gladia for the Series A.”

Given that most speech recognition models today are trained predominantly on English audio data and are therefore inherently biased, Gladia prioritized building the first real-time product that is truly multilingual.

The new fine-tuned engine delivers advanced real-time transcription in over 100 languages, along with enhanced support for accents and the unique ability to adapt to different languages on the fly.

Gladia’s new engine is unique in its ability to extract insights from a call—like the caller’s sentiment, key information, and conversation summary—in real-time. This means it takes less than a second to generate both transcript and insights from a call or meeting using Gladia.

New real-time AI transcription

Gladia founders Jonathan Soto (left) and Jean-Louis Quéguiner.

Building an accurate, low-latency, and multilingual engine in-house is a complex and resource-intensive task. It requires extensive expertise in language understanding, real-time data handling, with continuous optimization and maintenance. Real-time models require more computing power and may struggle to produce accurate output immediately due to limited context.

Gladia’s new product allows companies to bypass these challenges. The real-time speech-to-text engine boasts an industry-leading latency of under 300 milliseconds without compromising accuracy, regardless of the language, geography, or tech stack used.

“Companies are spending valuable time and resources trying to incorporate multiple AI functions into their existing platforms,” said Jonathan Soto, CTO of Gladia, in a statement. “Our single API is compatible with all existing tech stacks and protocols, including SIP, VoIP, FreeSwitch, and Asterisk. This allows us to easily integrate real-time transcription and analysis into our customers’ AI platforms, so they can focus on delivering the best services to their end users.”

What’s ahead

The company’s first async transcription and audio intelligence API launched in June 2023 and was based on a proprietary version of Whisper ASR.

It rapidly gained traction in the enterprise market, particularly with meeting recorders and note-taking assistants. The API is now adopted by over 600 customers around the world, including Attention, Circleback, Method Financial, Recall, Sana, and VEED.IO and has more than 70,000 users.

“Gladia’s technology allows companies in vertical markets that need cutting-edge real-time transcription, including sales enablement and contact center platform, to shift seamlessly from manual post-call processing to proactive, low-latency workflows,” Quéguiner said. “Whether it’s automated CRM enrichment or real-time guidance for support agents, Gladia is designed to help businesses operate smarter and more efficiently in record time, without requiring AI expertise in-house.”

Gladia will use the new capital to advance its R&D efforts and soon bring to market a one-stop AI toolkit for audio and expand its product offering with additional à la carte models—including large language models (LLMs) and retrieval-augmented generation (RAG). With several design partners in the contact-center-as-a-service (CCaaS) segment, the company is currently piloting an agent-assist solution powered by Gladia’s real-time AI engine. Additionally, Gladia will continue to expand its talent base as it prepares for international expansion.

“We are multilingual, and we have something that is called ‘code switching,’ which makes it unique,” Quéguiner said. “You can start with the language and switch to another.”

He went on to show me that he could start a call in English and initiate the transcription. Then he spoke French words, and the model correctly translated it in French.

“Keep in mind that (others) are not real time right now, and this one is real time,” he said. “Usually, real time is a little bit less accurate. You can also have your own custom vocabulary in real time, which is pretty unusual, with us. We have the capability to extract some real-time insights.”

The service has an AI summarizer, and it will have new optional features in the coming months. Quéguiner said that his service can also get acronyms right and detect the switch to another language.

“The model we use is very similar to LLMs (large language models). It has no code decoder architecture, which is not the case for most of the models that you’ve seen with Fireflies, for instance.

The market includes “meeting recorders,” Quéguiner said. The results can be passed on to real-time insights, which can help people like sales leads close deals faster.

The company also works with Call Centers, giving them 30% faster time to completion when they are on the phone thanks to better accuracy. The company will charge a flat fee such as a per-hour pricing.


Leave a Reply

Your email address will not be published. Required fields are marked *