IBM i NASA współpracują nad LLM

Największy open-source’owy geoprzestrzenny model fundamentalny sztucznej inteligencji pojawi się Hugging Face. Ma pomóc w walce ze zmianami klimatu.

Screen z fimu IBM na YouTube

IBM poinformowała w czwartek 3 sierpnia, że nawiązała współpracę z amerykańską agencją kosmiczną NASA w celu wspólnego opracowania fundamentalnego dużego modelu językowego opartego na danych geoprzestrzennych, który, jak twierdzi IBM, pomoże naukowcom i ich organizacjom w walce ze zmianami klimatu.

Dostęp do najnowszych danych pozostaje poważnym wyzwaniem w nauce o klimacie, gdzie warunki środowiskowe zmieniają się niemal codziennie. I pomimo rosnącej ilości danych - szacunki NASA sugerują, że do 2024 r. naukowcy będą mieli 250 000 terabajtów danych z nowych misji - naukowcy i badacze wciąż napotykają przeszkody w analizowaniu tych dużych zbiorów danych.

Zobacz również:

  • Copilot znaczy po polsku wsparcie
  • Chcą zainstalować sieć światłowodową na Księżycu. "W imię nauki"
  • System MS-DOS wrócił po latach w postaci open source

W ramach umowy Space Act Agreement z NASA, IBM postanowił na początku tego roku zbudować model oparty na sztucznej inteligencji dla danych geoprzestrzennych. Teraz poinformował, że model jest już gotowy.

Jest to również część trwającej dekadę inicjatywy NASA Open-Source Science Initiative, mającej na celu zbudowanie bardziej dostępnej, integracyjnej i opartej na współpracy społeczności naukowej. NASA, wraz z Białym Domem i innymi agencjami federalnymi, ogłosiła rok 2023 Rokiem Otwartej Nauki, aby uczcić korzyści i sukcesy osiągnięte dzięki otwartemu udostępnianiu danych, informacji i wiedzy.

Model open source, który będzie dostępny na Hugging Face, został opracowany na platformie IBM watsonx.ai i przeszkolony w zakresie zharmonizowanych danych satelitarnych Landsat Sentinel-2 (HLS) w ciągu jednego roku w kontynentalnych Stanach Zjednoczonych, zanim został dopracowany na podstawie oznaczonych danych do mapowania powodzi i blizn po oparzeniach - naukowego procesu mapowania dużych incydentów pożarów środowiska, podała firma.

„Zasadnicza rola technologii open-source w przyspieszeniu krytycznych obszarów odkryć, takich jak zmiany klimatu, nigdy nie była wyraźniejsza”, powiedział Sriram Raghavan, wiceprezes IBM Research AI. „Łącząc wysiłki fundacji IBM mające na celu stworzenie elastycznych systemów sztucznej inteligencji wielokrotnego użytku z repozytorium danych satelitarnych Ziemi NASA i udostępniając je na wiodącej platformie sztucznej inteligencji typu open source, Hugging Face, możemy wykorzystać siłę współpracy, aby wdrożyć szybsze i bardziej wpływowe rozwiązania, które poprawią naszą planetę”.

Będzie to największy geoprzestrzenny model fundamentalny na Hugging Face i pierwszy w historii model fundamentalny AI typu open source zbudowany we współpracy z NASA.

„Sztuczna inteligencja pozostaje dziedziną opartą na nauce, a nauka może rozwijać się tylko dzięki wymianie informacji i współpracy”, skomentował całą sprawę Jeff Boudier, szef produktu i rozwoju w Hugging Face. „Właśnie dlatego sztuczna inteligencja typu open source oraz otwarte udostępnianie modeli i zbiorów danych mają tak fundamentalne znaczenie dla dalszego postępu sztucznej inteligencji i zapewnienia, że technologia przyniesie korzyści jak największej liczbie osób”.

Testując dokładność modelu, naukowcy z IBM zauważyli 15% poprawę precyzji w porównaniu z istniejącymi modelami uczenia się do mapowania powodzi i blizn po pożarach, przy użyciu o połowę mniejszej ilości oznaczonych danych. Według IBM, poprawa ta może przyspieszyć analizę geoprzestrzenną od trzech do czterech razy i pomóc zmniejszyć ilość czyszczenia danych i etykietowania wymaganego do szkolenia tradycyjnego modelu głębokiego uczenia się. „Dzięki dodatkowemu dostrojeniu model bazowy może zostać ponownie wdrożony do zadań takich jak śledzenie wylesiania, przewidywanie plonów lub wykrywanie i monitorowanie gazów cieplarnianych”, czytamy w oświadczeniu IBM.

Według IBM i NASA, wydanie modelu nabiera znaczenia, ponieważ dostęp do najnowszych danych geoprzestrzennych i ich analiza pozostaje poważnym wyzwaniem w nauce o klimacie, pomimo regularnego dodawania dużych ilości danych. Model może służyć jako baza do analizy zbiorów danych w celu rozwoju zastosowań sztucznej inteligencji w walce ze zmianami klimatu. „Wierzymy, że modele fundacyjne mają potencjał, aby zmienić sposób analizy danych obserwacyjnych i pomóc nam lepiej zrozumieć naszą planetę”, komentuje Kevin Murphy, Chief Science Data Officer, NASA. „A dzięki otwartemu pozyskiwaniu takich modeli i udostępnianiu ich światu, mamy nadzieję zwielokrotnić ich wpływ”.

Dzięki dodatkowemu dostrojeniu model bazowy może zostać ponownie wdrożony do zadań takich jak śledzenie wylesiania, przewidywanie plonów lub wykrywanie i monitorowanie gazów cieplarnianych. Naukowcy IBM i NASA współpracują również z Clark University w celu dostosowania modelu do zastosowań takich jak segmentacja szeregów czasowych i badania podobieństwa.

Na YouTube można obejrzeć filmy demonstrujący rozwiązanie:

Komercyjna wersja modelu geoprzestrzennego, który jest częścią IBM watsonx, będzie dostępna za pośrednictwem IBM Environmental Intelligence Suite (EIS) jeszcze w tym roku.

Źródło: Blog IBM Research

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200