Você acha que o GPT-4 é um grande negócio? Esses novatos em IA generativa já estão roubando a cena!
LlaMA 2 é uma família de modelos de linguagem grande de código aberto de última geração lançados pela Meta AI. Você pode usá-lo para uso comercial e ele vem com código, modelos pré-treinados e modelos ajustados. Todos os recursos estão disponíveis no HuggingFace, e você pode até experimentar o desempenho do modelo experimentando-o no HuggingChat. Ao disponibilizar abertamente o Llama 2, a Meta AI permite que pesquisadores e desenvolvedores criem aplicativos inovadores alimentados por recursos de linguagem avançados.
Claude 2
Claude 2 é a mais recente iteração do assistente de IA conversacional da Anthropic. Ele melhorou o desempenho, respostas mais longas e pode ser acessado via API, bem como por um novo site beta público, claude.ai. Os desenvolvedores da Anthropic se concentraram em aprimorar suas habilidades em áreas como codificação, matemática e raciocínio lógico em comparação com as versões anteriores do Claude. Por exemplo, Claude2 obteve recentemente 76,5% na seção de múltipla escolha do exame da Ordem, um salto significativo em relação aos 73,0% de Claude 1.3.
Você pode acessar todos os tipos de modelos de Claude no Poe e experimentar a performance você mesmo.
PaLM 2
Google AI PaLM 2 é o modelo de linguagem grande mais recente do Google que se destaca em tarefas avançadas de raciocínio, incluindo código, matemática, classificação, resposta a perguntas, tradução, proficiência multilíngue e geração de linguagem natural. Ele supera os modelos de linguagem grandes de última geração anteriores, como o PaLM original, em todos esses recursos, devido à sua abordagem otimizada de escalabilidade computacional, mistura aprimorada de conjuntos de dados e melhorias arquitetônicas.
Você pode acessá-lo gratuitamente usando o Bard. Há um encantamento, mas ainda está longe da qualidade e desempenho do GPT-4.
Vicuna 1.3
Vicuna-33b-v1.3 foi ajustado pelo LLaMA com ajuste fino de instruções supervisionadas em conversas de 125 mil coletadas em ShareGPT.com. É um dos muitos modelos de melhor desempenho no Open LLM Leaderboard. Você pode acessar o modelo gratuitamente no HuggingFace ou experimentar a demonstração oficial em lmsys.org.
MPT-30B-chat
MPT-30B-Chat é um chatbot que foi ajustado para gerar os diálogos. Ele foi criado ajustando o MPT 30B em vários conjuntos de dados de diálogo (ShareGPT-Vicuna, Camel-AI, GPTeacher, Guanaco, Baize e alguns conjuntos de dados gerados). MPT-30B-Chat é um dos modelos principais na tabela de classificação do Open LLM e você pode experimentá-lo gratuitamente no Hugging Face Space da mosaicml.
Conclusão
Embora o GPT-4 permaneça fechado e inacessível, grandes modelos de linguagem de código aberto estão surgindo como alternativas que qualquer pessoa pode usar. Modelos como o Claude2 da Anthropic, o LLaMA2 da Meta e o MPT-30B mostram um progresso notável na capacidade de conversação, raciocínio e versatilidade multilíngue. Embora não sejam tão massivos em escala quanto o GPT-4, esses modelos disponíveis gratuitamente demonstram que a linguagem de IA de última geração continua a avançar rapidamente. Seus pontos fortes em áreas como matemática, codificação e lógica os tornam substitutos capazes para muitas aplicações.
Após o lançamento dos modelos LlaMA2, houve um boom de modelos de alto desempenho que são ajustados em vários conjuntos de dados. Você pode conferir todos eles no Open LLM Leaderboard.