Wywiad wykonawczy: Dodanie zdrowego rozsądku do generatywnej kreatywności AI


Między nimi istnieje zdrowa relacja duże modele językowe (LLM) i grafowe bazy danych, które służą do gromadzenia informacji z różnych sieci danych, zgodnie z Jim Webber, główny naukowiec w Neo4j.

„Computer Weekly” rozmawiał z Webberem po ratyfikacji umowy Norma ISO GQLktóry zapewnia standardowy sposób wyszukiwania w grafowych bazach danych i jest analogiczny do standardu ISO SQL-86 dotyczącego systemów zarządzania relacyjnymi bazami danych.

Grafowe bazy danych przyjmują zupełnie inne podejście do zapytań o dane niż relacyjne bazy danych. Webber współpracuje z grafowymi bazami danych od około 16 lat, z czego 14 lat w Neo4j. Chociaż Webber widzi rolę relacyjnych baz danych, głównym punktem Webbera jest to, że wydajność środowiska wykonawczego relacyjnej bazy danych ulega pogorszeniu.

Podstawową ideą systemu relacyjnych baz danych jest organizacja danych w sposób zorientowany na wiersze i łączenie zasobów danych za pomocą „złączy”, aby połączyć wiersze w jednej tabeli bazy danych z wierszami w drugiej, tworząc relację między nimi. Prostym przykładem jest wiersz identyfikujący unikalne referencje klienta w jednej tabeli, łączący się z danymi kontaktowymi klienta przechowywanymi w innej tabeli.

„Jak na ironię, relacyjne bazy danych słabo radzą sobie z łączeniami” – mówi. „To jedyna rzecz, której nie chcesz robić w relacyjnej bazie danych, ponieważ robisz to w czasie wykonywania drogiej części systemu” – mówi Webber.

Jego zdaniem dzieje się tak dlatego, że złączenia są skutecznie uruchamiane w pamięci i występują, gdy aplikacja lub użytkownik uruchamia zapytanie wymagające przeszukania wielu tabel bazy danych.

Reklama

Jednak pomimo tej widocznej nieefektywności relacyjne bazy danych są podstawową platformą danych dla wielu aplikacji korporacyjnych.

„Sieci graficzne umożliwiają modelowanie [messy data] w sposób wysokiej jakości, bez cierpienia i złożoności związanej z koniecznością tworzenia skomplikowanych tabel i schematów oraz wykonywania złączeń w czasie wykonywania”

Jim Webber, Neo4j

„W dawnych czasach korzystanie z relacyjnych baz danych miało sens, ponieważ wszystkie dane były identyczne” – dodaje. Webber nawiązuje do faktu, że coś w rodzaju systemu płac przechowuje tysiące instancji identycznie sformatowanych danych dla tysięcy pracowników.

Mówi: „Świat, w którym żyliśmy w latach 80., był jednolity, podobnie jak świat, w którym żyliśmy w latach 90., był w większości jednolity, dlatego użycie relacyjnej bazy danych było całkowicie sensowne”.

Webber twierdzi jednak, że wraz z eksplozją systemów, która miała miejsce niedawno, w danych pojawił się większy bałagan. „Sieci grafowe umożliwiają modelowanie tego bałaganu z dużą wiernością, bez odczuwania bólu związanego z bombą łączenia oraz złożoności związanej z koniecznością budowania złożonych tabel i schematów oraz wykonywania złączeń w czasie wykonywania” – mówi.

Zaufanie do GQL

Webber wierzy w nowo ratyfikowana norma ISO dotycząca języka zapytań grafowych (GQL) stanowi znaczący punkt zwrotny dla technologii. Norma ISO dla strukturalny język zapytań (SQL)zwany SQL-86, został opublikowany w 1986 roku.

Przypominając znaczenie tego standardu, Webber mówi, że „programował w tamtym momencie ZX Spectrum”, więc „SQL nic dla mnie nie znaczył”. Jednak standard SQL-86 rozstrzygnął debatę rozpoczętą w latach 70. XX wieku na temat zarządzania bazami danych. Edgar Cobb podczas pracy w IBM opracował model relacyjnej bazy danych. Standard SQL – przyjęty przez Amerykański Narodowy Instytut Normalizacyjny (ANSI) w 1986 r. i Międzynarodową Organizację Normalizacyjną (ISO) w 1987 r. – dał twórcom aplikacji i nabywcom oprogramowania dla przedsiębiorstw pewność korzystania z relacyjnych baz danych.

Alternatywna propozycja, czyli sieciowa baza danych, opracowana przez Charlesa Bachmana, przegrała. Jednak według Webbera podejście Bachmana jest starożytnym prekursorem grafowych baz danych.

Wierzy, że standardy są ważne, gdy decydenci IT muszą stawiać na technologię. „CIO są zdenerwowani, ponieważ jeśli dokonasz znaczącej inwestycji w system, nie chcesz, aby został w nim zamknięty lub odkryłeś, że system nie ma przyszłości i postawiłeś na złego konia. To analogia VHS i Betamax. Myślę, że SQL dał znaczący zastrzyk na rynek oprogramowania aplikacyjnego, ponieważ powiedział wszystkim, że technologia relacyjnych baz danych jest dojrzała i bezpieczna.

Według Webbera standard ISO GQL, podobnie jak SQL-86, chroni nabywców IT przed podejmowaniem złych decyzji handlowych. Mimo że istnieją różne dialekty języka SQL, podstawowa składnia pozostaje taka sama. To samo powinno dotyczyć GQL.

„Zasadniczo zawsze możesz zmienić dostawcę, ponieważ Twój język pozostanie ten sam” – mówi. „Dodatkowa nauka, jaką muszę zdobyć, aby specjalizować się w systemach zarządzania relacyjnymi bazami danych, takimi jak SQL Server czy Oracle, jest marginalna”.

AI zdrowy rozsądek

Analityk Gartner umieścił niedawno wykresy wiedzy w centrum swojego radaru wpływu generatywna sztuczna inteligencja (GenAI).

„Graficzne bazy danych są wykresy wiedzy, sieć faktów, która stanowi najwłaściwszą przeciwwagę dla GenAI” – mówi Webber. Jeśli GenAI jest jak kreatywna prawa strona mózgu, uważa, że ​​wykresy są jak lewa strona, która jest bardziej skupiona na rozumowaniu.

Grafowe bazy danych to wykresy wiedzy, czyli sieć faktów, które stanowią najbardziej odpowiednią przeciwwagę dla GenAI

Jim Webber, Neo4j

„Masz silnik probabilistyczny w generatywnej sztucznej inteligencji. Kocham to. Wiem, że to robot, ale mimo to wydaje mi się, że jest to niebezpiecznie, cudownie blisko posiadania tej iskry wyobraźni” – mówi. „Ale tę iskrę trzeba ostudzić i okazuje się, że wykresy wiedzy są w tym szczególnie dobre, wykorzystując podejście zwane grafem RAG”. W tym miejscu baza danych grafów dostarcza informacji kontekstowych dla LLM.

„To prawdopodobnie najlepszy sposób, jaki znamy, aby w pełni wykorzystać generatywną sztuczną inteligencję, jednocześnie zapobiegając przedostawaniu się kłamstw i wprowadzających w błąd informacji do użytkownika końcowego. To lewa półkula współpracuje z prawą półkulą.”

W trakcie dyskusji Webber przywołuje przykład, o którym mowa podczas a Audycja Narodowego Radia Publicznego (NPR). gdzie badacz sztucznej inteligencji zapytał LLM, ile czasu zajmie suszenie dwóch koszul na sznurku do prania, jeśli suszenie jednej zajmie trzy godziny. Odpowiedź brzmi oczywiście trzy, ale LLM może uznać, że dwie koszulki zajęłyby dwa razy więcej czasu.

„Możesz zapobiec wyciekaniu tych kłamstw, umieszczając mapę wektorów na wykresach wiedzy, które można przeglądać” – mówi Webber.

Mówi na przykład, że użytkownik, któremu wyświetli się słowo „jabłko”, może chcieć, aby system sztucznej inteligencji zrozumiał, że chodzi o firmę z Cupertino, która produkuje iPody i iPhone’y. Za pomocą wykresów mówi: „Możesz przeglądać bogatą sieć faktów na temat Apple, firmy technologicznej. To nie jest jabłko, ani owoc, ani Apple, wytwórnia płytowa Beatlesów.” W efekcie baza danych grafów stosuje do LLM poziom zdrowego rozsądku, który na podstawie kontekstu pomaga skierować jego odpowiedzi na odpowiedzi, które mają większy sens.

„Tam, gdzie istnieje sieć faktów do wykorzystania, żaden inny model danych nie zapewnia takiej sieci faktów” – twierdzi Webber. „W dzisiejszych czasach tę sieć faktów można wykorzystać, pisząc kod zapytania w języku SQL”.

Biorąc jednak pod uwagę nieefektywność, o której mówi Webber w używaniu SQL do wykonywania złączeń między wieloma źródłami danych, uruchamianie GQL na wykresie wiedzy może być sposobem, w jaki sztuczna inteligencja uczy się zdrowego rozsądku w przyszłości.



Source link

Advertisment

Więcej

Advertisment

Podobne

Advertisment

Najnowsze

Toshiba pokazuje dyski twarde o pojemności 32 TB z dyskami wspomaganymi termicznie i gontowymi

Przez Opublikowany: 20 maja 2024 12:22 Toshiba pokazała 32 TB (terabajt) i 31 TB dysk twardy (HDD), które wykorzystują zapis magnetyczny wspomagany ciepłem i...

Kanada i Wielka Brytania w kolejce do pierwszego międzynarodowego wdrożenia Vision Pro

Czekamy na pierwszy etap Wizja Pro wkrótce potem nastąpi międzynarodowe wdrożenie WWDCi pojawiły się wskazówki dotyczące niektórych konkretnych krajów. Obecnie mówi się,...

NVIDIA RTX 4070 Ti SUPER z modemem G6X 26 Gb/s pokonuje RTX 4080

Modderzy kart graficznych z Brazylii, TecLab i Paulo Gomes, powracają z kolejnym odważnym, konkurencyjnym modem VGA. Duet zyskał już reputację dzięki modom...
Advertisment