Reddit planeja cobrar empresas pelo uso de seus arquivos em treinamento de modelos de IA
O Reddit, plataforma de discussões e notícias, anunciou que começará a cobrar empresas pelo uso de seus arquivos para treinamento de modelos de inteligência artificial (IA). A medida será aplicada para empresas que desejam treinar grandes modelos de linguagem com conteúdo gerado principalmente por humanos no subreddit u/420NarutoConspiracy. O fundador e CEO do Reddit, Steve Huffman, afirmou recentemente ao The New York Times que a nova política será detalhada em um post futuro. Os desenvolvedores que trabalham em bots e outras ferramentas do Reddit, bem como pesquisadores que trabalham em projetos acadêmicos ou não-comerciais, continuarão tendo acesso gratuito à API.
Os preços serão anunciados nas próximas semanas, segundo Huffman, que destacou que o corpus de dados do Reddit é muito valioso para ser fornecido gratuitamente às maiores empresas do mundo. No entanto, o acesso à rede da empresa sempre foi uma forma muito forte da comunidade colaborar entre si.
As alterações no sistema ocorrem pouco antes da oferta pública inicial (IPO) da empresa, prevista para o segundo semestre de 2023. A proposta, registrada apenas boca-a-boca pela empresa em dezembro passado, tinha como objetivo obter uma avaliação máxima de US$ 15 bilhões. No entanto, a instabilidade no mercado impediu o avanço nos planos.
Desde sua abertura em 2005, os comentários e conversas no Reddit têm sido uma fonte crucial para o treinamento dos modelos de IA aprendizagem automática supervisionada (LLM). Empresas como ChatGPT e Google’s Bard citam dados do Reddit como uma de suas fontes para a aprendizagem de IA. Segundo o The Washington Post, a compilação de texto incluindo links mais bem avaliados pelos usuários do Reddit está disponível no GPT-3.
O Reddit promete ferramentas melhoradas para trabalhar em suas comunidades já existentes e proporcionar aos desenvolvedores acesso mais fácil à API, incluindo Reddit iOS e Android. Isso o torna um espaço muito importante para replicação de experimentos sobre aprendizado de máquina.
Notícia | Detalhes |
Reddit planeja cobrar empresas por treinamento de modelo de linguagem AI | Empresas que desejarem treinar um grande modelo de linguagem AI com conteúdo gerado principalmente por humanos em seu subreddit u/420NarutoConspiracy terão que pagar. Desenvolvedores trabalhando em bots e outras ferramentas do Reddit e pesquisadores trabalhando em projetos acadêmicos ou não-comerciais ainda terão acesso gratuito à API. |
Preços ainda não foram divulgados | Os detalhes sobre os preços serão anunciados nas próximas semanas. |
Corpus de dados do Reddit é muito valioso | Segundo o fundador e CEO do Reddit, Steve Huffman, o corpus de dados do Reddit é muito valioso para ser fornecido gratuitamente às maiores empresas do mundo. |
Reddit promete ferramentas melhoradas | O Reddit promete ferramentas melhoradas para trabalhar em suas comunidades já existentes e proporcionar aos desenvolvedores acesso mais fácil à API incluindo Reddit iOS e Android. |
Com informações do site Ars Technica.