Stability AI, start-up stojący za napędzanym przez sztuczną inteligencją generatorem tekstu na obraz Stable Diffusion , uruchomił pierwszy z zestawu dużych modeli językowych, które mogą konkurować z GPT-4 OpenAI.

Modele językowe, zwane łącznie StableLM, są open source, co oznacza, że programiści mogą je swobodnie sprawdzać, wykorzystywać i dostosowywać do celów komercyjnych lub badawczych, z zastrzeżeniem warunków licencji.

Londyńska Stability AI powiedziała, że wersja Alpha modelu jest dostępna w parametrach 3 i 7 miliardów, a modele parametrów od 15 do 65 miliardów do naśladowania. Dla porównania GPT-3 OpenAI ma 175 miliardów parametrów.

„Wraz z wprowadzeniem pakietu modeli StableLM, Stability AI nadal udostępnia podstawową technologię AI wszystkim”, napisał start-up w ogłoszeniu na swojej stronie internetowej.

„Nasze modele StableLM mogą generować tekst i kod oraz będą zasilać szereg dalszych aplikacji. Pokazują, jak małe i wydajne modele mogą zapewnić wysoką wydajność po odpowiednim przeszkoleniu”.

StableLM opiera się na wcześniejszej pracy nad modelem językowym Stability AI z centrum badawczym non-profit EleutherAI. Te modele językowe zostały przeszkolone na zbiorze danych typu open source o nazwie The Pile, który obejmuje informacje z różnych źródeł, w tym z Wikipedii, Stack Exchange i PubMed.

Najnowszy model językowy Stability AI został przeszkolony na znacznie większej wersji The Pile, zawierającej 1,5 biliona tokenów treści.

„Bogactwo tego zestawu danych zapewnia StableLM zaskakująco wysoką wydajność w zadaniach związanych z konwersacją i kodowaniem, pomimo niewielkich rozmiarów od 3 do 7 miliardów parametrów”, powiedziała firma.

Dostępne już na GitHub i Hugging Face, platformie do hostowania modeli i kodu AI, StableLM jest wynikiem planu Stability AI, aby stworzyć technologię AI, która jest „przejrzysta, dostępna i wspierająca”.

„Modele językowe będą stanowić podstawę naszej gospodarki cyfrowej i chcemy, aby każdy miał głos w sprawie ich projektowania”.

Na początku tego roku firma Stability AI została pozwana przez giganta hostingowego Getty Images za „bezczelne naruszenie” jej własności intelektualnej „na oszałamiającą skalę”.

Start-up rzekomo skopiował ponad 12 milionów zdjęć – wraz z podpisami i metadanymi – z kolekcji Getty Images bez uzyskania zgody ani wynagrodzenia.

10 rzeczy, które musisz wiedzieć prosto do swojej skrzynki pocztowej każdego dnia tygodnia. Zarejestruj się, aby otrzymywać Daily Brief , przegląd najważniejszych wiadomości z dziedziny nauki i technologii w Silicon Republic.

Zdjęcie: © Stable Diffusion XL