Spracherkennungs-API - Smodin Blog

Smodin gibt die Veröffentlichung seines neuen . bekannt Spracherkennungs-API Unterstützung von 176 Sprachen

Da zur Verbesserung unserer Anwendungen ein Sprachdetektor benötigt wurde, haben wir uns entschlossen, eine Lösung zu finden.

Zuerst dachten wir, es wäre einfach, da Google es so einfach aussehen lässt, aber wie wir herausfanden, war es keine leichte Aufgabe, im Gegenteil, die Spracherkennung war schon immer eine schwierige Aufgabe.

Auf der Suche nach der besten Option zur Vorhersage einer Sprache aus Text, die kein großes Modell für maschinelles Lernen erforderte, fanden wir heraus, dass die beste Lösung ein vortrainiertes Spracherkennungsmodell war, das weniger als 1 MB Speicher benötigt und gleichzeitig in der Lage ist klassifizieren Tausende von Dokumenten pro Sekunde.

Nach vielen Optimierungen und Verbesserungen haben wir ein Tool entwickelt, das selbstbewusst gute Genauigkeitsraten für jede Sprache liefern kann.

Bietet wirklich gute Genauigkeitsbewertungen, und das nicht nur, sondern auch mit einer schnellen und zuverlässigen Geschwindigkeit. Hier ist eine Genauigkeitsliste pro Land.

99% genaue Sprachen*: Französisch (fr), Englisch (en), Deutsch (de), Portugiesisch (pt), Türkisch (tr), Niederländisch (nl), Italienisch (it), Spanisch (es), Ungarisch (hu) , Esperanto (eo), Polnisch (pl), Finnisch (fi), Russisch (ru), Mazedonisch (mk), Ukrainisch (uk), Litauisch (lt), Vietnamesisch (vi), Griechisch (el), Marathi (mr) , Arabisch (ar), Hebräisch (he), Hindi (hi), Uigurisch (ug), Japanisch (ja), Georgisch (ka), Bengali (bn), Urdu (ur), Thai (th), Chinesisch (zh) , Armenisch (hy), Malayalam (ml), Koreanisch (ko), Khmer (km), Burmesisch (my), Tamil (ta), Kannada (kn), Telugu (te), Panjabi (pa), Lao (lo) , Gujarati (gu), Tibetischer Standard (bo), Divehi (dv), Singhalesisch (si), Amharisch (am).

90% genaue Sprachen*: Dänisch (da), Rumänisch (ro), Schwedisch (sv), Latein (la), Bulgarisch (bg), Tschechisch (cs), Tagalog (tl), Indonesisch (id), Tatar (tt) , Isländisch (is), Weißrussisch (be), Baskisch (eu), Bretonisch (br), Kasachisch (kk), Lettisch (lv), Estnisch (et), Irisch (ga), Tschuwaschisch (cv), Baschkirisch (ba) , Ossetisch (os), Tadschikisch (tg).

*Informationen werden in der Reihenfolge der meisten Testdaten angezeigt. Die Daten waren Sätze von 30-250 Zeichen Länge. Es wurden nur die 100 beliebtesten Sprachen getestet. Tests ergaben für die meisten Sätze mit oder über 99 Zeichen eine Genauigkeit von nahezu 300 %.

Obwohl Sie keine perfekten Ergebnisse erzielen können, wird die beste Genauigkeit (99 %+ für viele Sprachen, auch die weniger bekannten) bei 300 Zeichen oder mehr erreicht. Unabhängig von der Textlänge gilt: je länger, desto besser.

Wie Wiki erwähnt: Spracherkennung oder Sprachraten ist das Problem der Bestimmung, in welcher natürlichen Sprache ein bestimmter Inhalt vorliegt. Computergestützte Ansätze zu diesem Problem betrachten es als einen Spezialfall der Textkategorisierung, die mit verschiedenen statistischen Methoden gelöst wird.

Spracherkennungsdienste können auf verschiedene Weise verwendet werden, beispielsweise könnten sie verwendet werden, um die Sprache von Geschäftstexten wie Chat und E-Mail zu identifizieren.
Der Dienst kann die Sprache des Textes und die Teile des Textes, bei denen sich die Sprache geändert hat, bis auf Wortebene identifizieren.
Mithilfe von Spracherkennungsdiensten kann Surveillance Insights die im Text verwendete Sprache hervorheben und kommentieren und dabei helfen, potenziell verdächtige Aktivitäten zu identifizieren.

Geschäftstexte wie E-Mail oder Chat können in verschiedenen Sprachen vorliegen. Ein wichtiger Teil der Verarbeitungspipeline für natürliche Sprache besteht darin, zu bestimmen, welche Sprache die Primärsprache ist, damit jeder Text durch verwandte sprachspezifische Schritte verarbeitet werden kann.
In einigen Fällen können Personen die in Chats verwendete Sprache ändern, um zu vermeiden, illegale Aktivitäten zu überwachen oder zu verbergen. Die Bestimmung des Zeitpunkts, an dem die Chat-Sprache umgeschaltet wird, ist sehr nützlich, um festzustellen, ob eine verdächtige Aktivität stattgefunden hat.

Wenn Sie unsere API verwenden möchten, erhalten Sie weitere Informationen darüber und die Preise, indem Sie auf klicken KLICKEN SIE HIER

Neben der Bereitstellung eines API-Dienstes haben wir uns auch entschieden, ihn als Open Source zu veröffentlichen.
Dies ist unser erstes Open-Source-Release! Spracherkennung Open Source, verfügbar KLICKEN SIE HIER