Meta heeft een verzameling AI-taalmodellen gepubliceerd die onderzoekers moeten taalmodellen helpen bij onderzoeken. De LLaMA-taalmodellen komen later niet publiekelijk beschikbaar. Meta werkt al jaren aan AI-taalmodellen, net als bijvoorbeeld Google en OpenAI.
Large Language Model Meta AI, of LLaMA, bestaat uit vier AI-taalmodellen uit verschillende groottes, die alle vier relatief klein zijn. waardoor ze volgens Meta minder rekenkracht dan andere AI-taalmodellen, wat ze beter geschikt maakt voor onderzoeksdoeleinden.
“Het afgelopen jaar hebben taalmodellen nieuwe mogelijkheden laten zien voor het maken van creatieve teksten, het oplossen van twijfelachtige stellingen, het bevestigen van eiwitstructuren en het beantwoorden van begrijpend-lezenvragen”, schrijft Meta. Dit doelt het bedrijf onder meer op de chatbots van bijvoorbeeld Google en Microsoft. Het Facebook-moederbedrijf zegt dat het lastig is om wetenschappelijk onderzoek te doen met deze modellen, omdat ze groot zijn dat er veel rekenkracht nodig is om te begrijpen hoe en waarom ze werken.
Meta zegt dat door deze koppeling, het lastiger is om de robuustheid te verbeteren en ‘bekende problemen als vooroordelen, toxiciteit en het potentieel verspreiden van desinformatie’ op te lossen. Het bedrijf hoopt dat met de kleinere taalmodellen hier beter onderzoek naar gedaan kan worden. De LLaMA-taalmodellen worden alleen na controle geleverd door onderzoekers die betrokken zijn bij overheidsinstellingen, maatschappelijke organisaties van wetenschappelijke instellingen. Afgelopen mei bracht Meta een ander taalmodel uit voor wetenschappelijk onderzoek.
credit :Source link