AI News

Unicórnio de Infraestrutura de IA de voz (Voice AI): LiveKit capta US$100 milhões com avaliação de US$1 bilhão

LiveKit, o provedor de infraestrutura de código aberto que alimenta a próxima geração de inteligência artificial em tempo real (real-time artificial intelligence), entrou oficialmente para a lista de unicórnios do setor de tecnologia. A empresa sediada em São Francisco anunciou na quinta-feira que levantou US$100 milhões em uma rodada de financiamento Série C, elevando sua avaliação para US$1 bilhão. Essa injeção significativa de capital destaca o papel crítico que a LiveKit passou a desempenhar na crescente pilha de IA, especialmente como o motor principal por trás do ChatGPT Advanced Voice Mode da OpenAI.

A rodada foi liderada pela Index Ventures, uma firma proeminente conhecida por apoiar mudanças tecnológicas geracionais, com participação continuada dos investidores existentes Altimeter Capital, Redpoint Ventures e Hanabi Capital. O financiamento ocorre menos de um ano após a Série B da empresa, evidenciando uma trajetória de crescimento agressiva alimentada pela demanda explosiva por agentes de IA multimodais (multimodal AI agents) capazes de enxergar, ouvir e falar em tempo real.

"Antecipamos que 2026 será o ano em que a IA de voz será amplamente implantada em milhares de casos de uso ao redor do mundo", disse Russ d’Sa, cofundador e CEO da LiveKit. O capital será utilizado para expandir a rede global "Real-time Cloud" da LiveKit e desenvolver ainda mais seu Agents API, uma estrutura projetada para simplificar a orquestração complexa necessária para interações de IA com baixa latência.

A parceria com a OpenAI: validando a infraestrutura

Central para a rápida ascensão da LiveKit está sua parceria estratégica com a OpenAI. Enquanto a IA generativa (Generative AI) tem se concentrado em grande parte em Modelos de Linguagem de Grande Escala (Large Language Models, LLMs) baseados em texto, a fronteira mudou para capacidades multimodais — especificamente voz e vídeo. A tecnologia da LiveKit serve como espinha dorsal para o Voice Mode do ChatGPT, lidando com a intricada transmissão de dados em nível de milissegundos necessária para fazer com que conversas com IA pareçam naturais e semelhantes às humanas.

Antes da LiveKit, desenvolvedores que tentavam construir bots de voz em tempo real eram forçados a montar serviços díspares: APIs distintas para speech-to-text (STT), a inferência do LLM e text-to-speech (TTS), tudo encapsulado em protocolos padrão HTTP ou WebSocket. Essa abordagem "remendada" frequentemente resultava em latências de 2–3 segundos ou mais — uma eternidade numa conversa que gera pausas constrangedoras e interrupções.

A LiveKit resolveu isso ao adaptar o WebRTC, o protocolo padrão para videoconferência, em uma camada de transporte de dados otimizada para IA. Ao gerenciar o fluxo de áudio diretamente entre o dispositivo do usuário e o modelo de IA, a LiveKit reduz a latência para menos de 300 milissegundos, o limiar necessário para o cérebro humano perceber uma interação como "em tempo real".

Sahir Azam, um investidor da Index Ventures, observou em um comunicado que a LiveKit está estabelecendo "uma das camadas de infraestrutura mais importantes na pilha de IA", tornando-se efetivamente o sistema nervoso que conecta modelos de IA ao mundo físico.

Dentro da tecnologia: o "sistema nervoso" para agentes de IA

A plataforma da LiveKit não é meramente um SDK de chamadas de vídeo; é um ambiente abrangente para construir agentes de IA "estadoful". Ao contrário de chatbots tradicionais que são stateless (esquecendo o contexto entre requisições HTTP), um agente de voz deve manter uma conexão contínua para lidar com interrupções, ruído de fundo e lógica de tomada de turno.

O Agents API da empresa permite que desenvolvedores construam esses fluxos de trabalho complexos em código, em vez de configuração. Ele orquestra o fluxo de dados entre vários provedores de modelos — como Deepgram para transcrição, OpenAI ou Anthropic para inteligência, e Cartesia ou ElevenLabs para síntese de voz — enquanto a LiveKit gerencia o networking.

Principais diferenciais técnicos

  • Ultra-baixa latência: rede global de borda (edge) otimizada especificamente para roteamento de áudio máquina-a-máquina e máquina-para-humano.
  • Nativo multimodal: construído para lidar com áudio, vídeo e canais de dados simultaneamente, possibilitando agentes que podem "ver" via entrada de câmera enquanto falam.
  • Orquestração ponta a ponta: gerencia a lógica difícil de "voice activity detection" (VAD), garantindo que a IA pare de falar imediatamente quando o usuário interrompe — uma marca de conversação natural.

Cenário competitivo: Infra especializada vs. Telecom legado

A ascensão da LiveKit perturba um mercado há muito dominado por provedores legados de plataformas de comunicação como serviço (CPaaS) como Twilio e SDKs centrados em vídeo como Agora. Enquanto esses incumbentes se destacam em conectar humanos a humanos, eles não foram arquitetados para as exigências de alta largura de banda e baixa latência dos modelos de IA comunicando-se com humanos.

A tabela a seguir ilustra como a LiveKit se posiciona contra concorrentes tradicionais no espaço em tempo real:

Feature LiveKit Agora Twilio
Primary Focus AI Agent Infrastructure Live Video/Audio Streaming Telephony & Messaging
Architecture WebRTC for AI (Data + Media) Proprietary Real-Time Network SIP / PSTN / HTTP
Open Source Core Yes (Apache 2.0) No (Closed Source) No (Closed Source)
AI Orchestration Native Agents Framework Partner Integrations Partner Integrations
Latency Target <300ms (Conversational) <400ms (Broadcasting) Variable (Telephony standards)
Developer Model Self-hostable or Cloud Cloud Only Cloud Only

A estratégia open-source da LiveKit foi instrumental em sua adoção. Ao permitir que engenheiros inspecionem o código e auto-hospedem a stack para testes, eles construíram uma comunidade de desenvolvedores com mais de 200.000 usuários. Essa adoção "de baixo para cima" espelha as estratégias de outros gigantes de infraestrutura como Vercel ou MongoDB, criando um fosso que soluções proprietárias acham difícil de ultrapassar.

Expansão da base de clientes: de startups a empresas

Embora a OpenAI seja o cliente de destaque, a utilidade da LiveKit vai muito além de chatbots para consumidores. A tecnologia está atualmente implantada por uma gama diversificada de gigantes empresariais, incluindo:

  • Tesla: utilizando a LiveKit para diagnósticos em tempo real e potenciais recursos de assistente de voz dentro do carro.
  • Salesforce: integrando recursos de voz em tempo real em suas plataformas Service Cloud e Agentforce.
  • xAI: aproveitando a infraestrutura para as capacidades multimodais do Grok.
  • Spotify: experimentando navegação por voz e funcionalidades de DJ por IA.

"Hoje, grandes empresas estão avaliando e construindo agentes de voz para automatizar fluxos de trabalho, melhorar experiências dos clientes e desbloquear novas receitas", escreveu d’Sa em um post no blog que acompanhou o anúncio do financiamento. Ele destacou que, embora muitos casos de uso estejam em estágio de prova de conceito, a transição para produção está se acelerando. Serviços financeiros estão usando a tecnologia para verificação de identidade via biometria de voz, enquanto provedores de saúde estão implantando agentes para triagem de pacientes antes que falem com um médico humano.

Roteiro futuro: a era da computação "morna" (Warm)

Com US$100 milhões em capital fresco, a LiveKit planeja ampliar sua equipe de engenharia e expandir sua presença de infraestrutura física. Uma parte significativa do roteiro é dedicada a capacidades de visão. À medida que modelos como GPT-4o e Gemini 1.5 Pro se tornam mais aptos a processar fluxos de vídeo, a LiveKit pretende ser o canal padrão para enviar feeds de câmera para LLMs para análise em tempo real.

Imagine um técnico de serviço de campo usando óculos inteligentes que pode falar com um agente de IA que "vê" a máquina quebrada através da câmera do técnico e destaca a peça correta a ser substituída em um display de cabeça erguida. Isso requer largura de banda e capacidades de sincronização que vão além do áudio simples, e a LiveKit está se posicionando para controlar esse pipeline.

Além disso, a empresa está investindo em edge computing. Para reduzir cada milissegundo possível de latência, a LiveKit está implantando seus servidores de mídia mais próximos do usuário final e dos centros de inferência de modelos, reduzindo o tempo de "ida e volta" dos pacotes de dados.

Insight da Creati.ai: infraestrutura é o novo ouro

Do ponto de vista da Creati.ai, a avaliação de US$1 bilhão da LiveKit sinaliza uma maturidade no mercado de IA generativa (Generative AI). O ciclo inicial de hype focou fortemente nos modelos de base em si (OpenAI, Anthropic, Google). Agora, o foco está mudando para a camada capacitada — as ferramentas e infraestruturas que permitem às empresas realmente construir produtos confiáveis sobre esses modelos.

A LiveKit identificou corretamente que o gargalo para a adoção de IA não é mais a inteligência, mas a interação. Se uma IA é inteligente, mas demora três segundos para responder, ela é inutilizável para atendimento ao cliente. Ao resolver o problema de latência e orquestração, a LiveKit não está apenas vendendo software; está vendendo a viabilidade da economia dos agentes de IA.

À medida que avançamos por 2026, esperamos ver uma consolidação nessa camada. Empresas que conseguirem oferecer um pipeline contínuo e sem atritos dos lábios do usuário até o "cérebro" do modelo e de volta capturarão um valor imenso. A LiveKit, com suas raízes open-source e profunda integração com a líder do setor OpenAI, está atualmente na posição de destaque para definir como humanos e máquinas se comunicarão na próxima década.

Em Destaque
AdsCreator.com
Gere instantaneamente criativos de anúncio polidos e alinhados à marca a partir de qualquer URL de website para Meta, Google e Stories.
VoxDeck
Criador de apresentações com IA que lidera a revolução visual
BGRemover
Remova facilmente os fundos de imagens online com o SharkFoto BGRemover.
Refly.ai
Refly.AI capacita criadores não técnicos a automatizar fluxos de trabalho usando linguagem natural e uma tela visual.
Qoder
Qoder é um assistente de codificação com IA que automatiza planejamento, codificação e testes para projetos de software.
Flowith
Flowith é um espaço de trabalho agêntico baseado em canvas que oferece gratuitamente 🍌Nano Banana Pro e outros modelos e
Skywork.ai
Skywork AI é uma ferramenta inovadora para aumentar a produtividade usando IA.
FineVoice
Transforme texto em emoção — Clone, desenhe e crie vozes de IA expressivas em segundos.
FixArt AI
FixArt AI oferece ferramentas de IA gratuitas e sem restrições para geração de imagens e vídeos sem necessidade de cadastro.
Elser AI
Estúdio web tudo‑em‑um que transforma texto e imagens em arte estilo anime, personagens, vozes e curtas‑metragem.
Pippit
Eleve sua criação de conteúdo com as poderosas ferramentas de IA da Pippit!
SharkFoto
SharkFoto é uma plataforma tudo-em-um com IA para criar e editar vídeos, imagens e música de forma eficiente.
Funy AI
Anime suas fantasias! Crie vídeos de beijos e biquínis com IA a partir de imagens ou texto. Experimente o trocador de ro
KiloClaw
Agente OpenClaw hospedado: implantação com um clique, mais de 500 modelos, infraestrutura segura e gerenciamento automatizado de agentes para equipes e desenvolvedores.
Diagrimo
Diagrimo transforma texto instantaneamente em diagramas e visuais gerados por IA personalizados.
SuperMaker AI Video Generator
Crie vídeos, músicas e imagens incríveis sem esforço com o SuperMaker.
AI Clothes Changer by SharkFoto
AI Clothes Changer da SharkFoto permite que você experimente roupas virtualmente e instantaneamente, com caimento, textura e iluminação realistas.
Yollo AI
Converse e crie com seu parceiro de IA. Vídeo a partir de imagem, gerador de imagens IA.
AnimeShorts
Crie animações impressionantes de anime sem esforço com tecnologia de IA de última geração.
Image to Video AI without Login
Ferramenta gratuita de IA de Imagem para Vídeo que transforma fotos instantaneamente em vídeos animados suaves e de alta qualidade sem marcas d'água.
InstantChapters
Gere capítulos de livros envolventes instantaneamente com o Instant Chapters.
Anijam AI
Anijam é uma plataforma de animação nativa de IA que transforma ideias em histórias refinadas com criação de vídeo agentiva.
Claude API
Claude API for Everyone
AI Video API: Seedance 2.0 Here
API unificada de vídeo com IA que oferece modelos de última geração por uma única chave e a menor custo.
WhatsApp AI Sales
WABot é um copiloto de vendas com IA para WhatsApp que fornece scripts em tempo real, traduções e detecção de intenção.
NerdyTips
Uma plataforma de previsões de futebol com IA que entrega dicas de jogos baseadas em dados em ligas globais.
wan 2.7-image
Um gerador de imagens de IA controlável para rostos precisos, paletas, texto e continuidade visual.
happy horse AI
Gerador de vídeo de IA de código aberto que cria vídeo e áudio sincronizados a partir de texto ou imagens.
HappyHorseAIStudio
Gerador de vídeo com IA baseado no navegador para texto, imagens, referências e edição de vídeo.
insmelo AI Music Generator
Gerador de música movido por IA que transforma prompts, letras ou uploads em canções polidas e livres de royalties em cerca de um minuto.
BeatMV
Plataforma de IA baseada na web que transforma músicas em videoclipes cinematográficos e cria música com IA.
UNI-1 AI
UNI-1 é um modelo unificado de geração de imagens que combina raciocínio visual com síntese de imagens de alta fidelidade.
Kirkify
Kirkify AI cria instantaneamente memes virais de troca de rosto com estética neon-glitch assinada para criadores de memes.
Iara Chat
Iara Chat: Um assistente de produtividade e comunicação com inteligência artificial.
Text to Music
Transforme texto ou letras em músicas completas com qualidade de estúdio, com vocais gerados por IA, instrumentos e exportações multi-faixa.
Wan 2.7
Modelo de vídeo AI de nível profissional com controle preciso de movimento e consistência multiview.
kinovi - Seedance 2.0 - Real Man AI Video
Gerador de vídeo AI gratuito com saída humana realista, sem marca d'água e com direitos completos de uso comercial.
Tome AI PPT
Criador de apresentações movido por IA que gera, embeleza e exporta slides profissionais em minutos.
Lyria3 AI
Gerador de música por IA que cria músicas totalmente produzidas e de alta fidelidade a partir de prompts de texto, letras e estilos instantaneamente.
Video Sora 2
Sora 2 AI transforma texto ou imagens em vídeos curtos para redes sociais e e‑commerce, com movimento fisicamente preciso, em minutos.
Atoms
Plataforma orientada por IA que cria apps e sites full‑stack em minutos usando automação multi‑agente, sem necessidade de codificação.
AI Pet Video Generator
Crie vídeos de pets virais e fáceis de compartilhar a partir de fotos usando modelos orientados por IA e exportações HD instantâneas para plataformas sociais.
Paper Banana
Ferramenta com IA para converter texto acadêmico em diagramas metodológicos prontos para publicação e gráficos estatísticos precisos instantaneamente.
Ampere.SH
Hospedagem OpenClaw gerenciada gratuita. Implemente agentes de IA em 60 segundos com $500 em créditos Claude.
Palix AI
Plataforma de IA tudo‑em‑um para criadores, gerando imagens, vídeos e música com créditos unificados.
GenPPT.AI
Criador de PPT movido por IA que cria, embeleza e exporta apresentações profissionais do PowerPoint com notas do orador e gráficos em minutos.
Hitem3D
Hitem3D converte uma única imagem em modelos 3D de alta resolução, prontos para produção, usando IA.
HookTide
Plataforma de crescimento no LinkedIn impulsionada por IA que aprende sua voz para criar conteúdo, engajar e analisar desempenho.
Seedance 20 Video
Seedance 2 é um gerador de vídeo IA multimodal que oferece personagens consistentes, narrativa em múltiplas tomadas e áudio nativo em 2K.
Create WhatsApp Link
Gerador gratuito de links e QR do WhatsApp com análises, links com marca, roteamento e recursos de chat multi‑agente.
Gobii
Gobii permite que equipes criem trabalhadores digitais autônomos 24/7 para automatizar pesquisa na web e tarefas rotineiras.
Veemo - AI Video Generator
Veemo AI é uma plataforma tudo-em-um que gera rapidamente vídeos e imagens de alta qualidade a partir de texto ou imagens.
Free AI Video Maker & Generator
Criador & Gerador de Vídeos com IA gratuito – Ilimitado, sem cadastro
AI FIRST
Assistente conversacional de IA que automatiza pesquisa, tarefas no navegador, web scraping e gerenciamento de arquivos através de linguagem natural.
GLM Image
GLM Image combina modelos híbridos autorregressivos e de difusão para gerar imagens de IA de alta fidelidade com renderização de texto excepcional.
ainanobanana2
Nano Banana 2 gera imagens 4K de qualidade profissional em 4–6 segundos com renderização de texto precisa e consistência de assunto.
WhatsApp Warmup Tool
Ferramenta de aquecimento do WhatsApp com IA automatiza envio em massa enquanto evita banimentos de contas.
TextToHuman
Humanizador de IA gratuito que reescreve instantaneamente texto gerado por IA para uma escrita natural, parecida com a humana. Não é necessário cadastro.
Manga Translator AI
AI Manga Translator traduz instantaneamente imagens de mangá para múltiplos idiomas online.
Remy - Newsletter Summarizer
Remy automatiza a gestão de newsletters ao resumir e-mails em insights fáceis de digerir.

LiveKit atinge avaliação de US$1 bilhão com parceria com a OpenAI e novo aporte

O provedor de infraestrutura de IA de voz LiveKit garantiu US$100 milhões em novo financiamento, atingindo uma avaliação de US$1 bilhão. A empresa fornece os recursos de voz do ChatGPT da OpenAI e está expandindo suas soluções de voz e vídeo em tempo real.