AWS dodało nowe języki do swojego produktu Amazon Transcribe, oferując generatywną transkrypcję opartą na sztucznej inteligencji dla 100 języków i mnóstwo nowych możliwości sztucznej inteligencji dla klientów.
Ogłoszono podczas wydarzenia AWS re: Invent, Amazon Transcribe może teraz rozpoznawać więcej języków mówionych i uruchamiać transkrypcję rozmów. Klienci AWS używają Transcribe, aby dodawać funkcje zamiany mowy na tekst do swoich aplikacji w chmurze AWS.
Firma podała w wpis na blogu that Transcribe przeszkolił się na „milionach godzin nieoznaczonych danych dźwiękowych z ponad 100 języków” i wykorzystuje samonadzorowane algorytmy do uczenia się wzorców ludzkiej mowy w różnych językach i akcentach. AWS twierdzi, że zapewnia to, że niektóre języki nie będą nadmiernie reprezentowane w danych szkoleniowych, aby zapewnić, że rzadziej używane języki będą równie dokładne, jak te częściej używane.
Pod koniec 2022 r. Amazon Transcribe obsługiwał 79 języków.
Według AWS, Amazon Transcribe ma dokładność od 20 do 50 procent w wielu językach. Oferuje także automatyczną interpunkcję, niestandardowe słownictwo, automatyczną identyfikację języka i niestandardowe filtry słownictwa. Rozpoznaje mowę w formatach audio i wideo oraz w hałaśliwym otoczeniu.
Krawędź skontaktował się z firmą AWS w celu uzyskania informacji na temat wcześniejszej dokładności i modeli podstawowych używanych w Amazon Transcribe.
AWS twierdzi, że dzięki lepszemu rozpoznawaniu języka postępy dzięki Amazon Transcribe przekładają się również na większą dokładność platformy Call Analytics, z której często korzystają klienci centrum kontaktowego. Amazon Transcribe Call Analytics, teraz także oparta na generatywnych modelach AI, podsumowuje interakcje pomiędzy agentem a klientem. Według AWS ogranicza to pracę związaną z tworzeniem raportów po rozmowie telefonicznej, a menedżerowie mogą szybko czytać informacje bez konieczności przeglądania całego transkrypcji.
Oczywiście AWS nie jest jedyną firmą oferującą usługi transkrypcji oparte na sztucznej inteligencji. Otter od jakiegoś czasu dostarcza transkrypcje AI konsumentom i przedsiębiorstwom w czerwcu udostępniło narzędzie podsumowujące. Chociaż nie jest to dokładnie to samo, Meta ogłosiła pracuje nad generatywnym modelem tłumaczenia opartym na sztucznej inteligencji, który rozpoznaje prawie 100 języków mówionych.
AWS ogłosiło także dodatkowe możliwości swojego produktu Amazon Personalizacja, który umożliwia klientom oferowanie produktów lub wyświetlanie rekomendacji klientom, na przykład w jaki sposób usługi przesyłania strumieniowego mogą sugerować nowe programy na podstawie wcześniejszej aktywności. AWS dodał funkcję Content Generation, która napisze tytuły lub tematy wiadomości e-mail, aby tematycznie połączyć listy rekomendacji.