స్మోడిన్ తన కొత్త విడుదలను ప్రకటించింది భాష గుర్తింపు API 176 భాషలకు మద్దతు ఇస్తుంది

మా అప్లికేషన్‌లను మెరుగుపరచడానికి లాంగ్వేజ్ డిటెక్టర్ అవసరం కాబట్టి, మేము ఒక పరిష్కారాన్ని కనుగొనాలని నిర్ణయించుకున్నాము.

మొదట, గూగుల్ దీన్ని చాలా తేలికగా కనిపించేలా చేయడం సులభం అని మేము అనుకున్నాము, కానీ మేము కనుగొన్నట్లుగా, ఇది అంత తేలికైన పని కాదు, దీనికి విరుద్ధంగా, భాష గుర్తింపు అనేది ఎల్లప్పుడూ కష్టమైన పని.

పెద్ద మెషీన్ లెర్నింగ్ మోడల్ అవసరం లేని టెక్స్ట్ నుండి భాషను అంచనా వేయడానికి ఉత్తమ ఎంపిక కోసం అన్వేషణలో, ఉత్తమమైన పరిష్కారం ముందుగా శిక్షణ పొందిన లాంగ్వేజ్ ఐడెంటిఫికేషన్ మోడల్ అని మేము కనుగొన్నాము. సెకనుకు వేలాది పత్రాలను వర్గీకరించండి.

అనేక సర్దుబాట్లు మరియు మెరుగుదలల తర్వాత, మేము ప్రతి భాషకు మంచి ఖచ్చితత్వ రేట్లను నమ్మకంగా అందించగల సాధనాన్ని అభివృద్ధి చేశాము.

మంచి ఖచ్చితత్వ రేటింగ్‌లను అందించడం, అంతే కాదు వేగవంతమైన మరియు నమ్మదగిన వేగంతో కూడా. ప్రతి దేశానికి ఖచ్చితత్వ జాబితా ఇక్కడ ఉంది.

99% ఖచ్చితమైన భాషలు*: ఫ్రెంచ్ (fr), ఇంగ్లీష్ (en), జర్మన్ (de), పోర్చుగీస్ (pt), టర్కిష్ (tr), డచ్ (nl), ఇటాలియన్ (అది), స్పానిష్ (es), హంగేరియన్ (hu) , ఎస్పెరాంటో (eo), పోలిష్ (pl), ఫిన్నిష్ (fi), రష్యన్ (ru), మాసిడోనియన్ (mk), ఉక్రేనియన్ (uk), లిథువేనియన్ (lt), వియత్నామీస్ (vi), గ్రీక్ (el), మరాఠీ (శ్రీ) , అరబిక్ (ar), హీబ్రూ (he), హిందీ (hi), ఉయ్‌ఘర్ (ug), జపనీస్ (ja), జార్జియన్ (ka), బెంగాలీ (bn), ఉర్దూ (ఉర్), థాయ్ (th), చైనీస్ (zh) , అర్మేనియన్ (హై), మలయాళం (ml), కొరియన్ (కో), ఖ్మేర్ (km), బర్మీస్ (my), తమిళ్ (ta), కన్నడ (kn), తెలుగు (te), పంజాబీ (pa), లావో (లో) , గుజరాతీ (gu), టిబెటన్ స్టాండర్డ్ (bo), దివేహి (dv), సింహళ (si), అమ్హారిక్ (am).

90% ఖచ్చితమైన భాషలు*: డానిష్ (da), రొమేనియన్ (ro), స్వీడిష్ (sv), లాటిన్ (la), బల్గేరియన్ (bg), చెక్ (cs), తగలోగ్ (tl), ఇండోనేషియన్ (id), టాటర్ (tt) . , ఒస్సేటియన్ (os), తాజిక్ (tg).

*చాలా పరీక్ష డేటా క్రమంలో సమాచారం అందించబడుతుంది. డేటా 30-250 అక్షరాల పొడవు గల వాక్యాలు. పరీక్ష అత్యంత ప్రాచుర్యం పొందిన 100 భాషలలో మాత్రమే జరిగింది. 99 అక్షరాల పొడవు లేదా అంతకంటే ఎక్కువ వాక్యాల కోసం పరీక్ష 300% ఖచ్చితత్వానికి దగ్గరగా చూపబడింది.

మీరు ఖచ్చితమైన ఫలితాలను పొందలేకపోయినప్పటికీ, అత్యుత్తమ ఖచ్చితత్వం (అనేక భాషలకు 99%+, అంతగా తెలియనివి కూడా) 300 అక్షరాలు లేదా అంతకంటే ఎక్కువ కనిపిస్తాయి. వచన పొడవుతో సంబంధం లేకుండా, ఇక మంచిది.

వికీ ప్రస్తావించినట్లుగా: భాష గుర్తింపు లేదా భాష ఊహించడం అనేది ఏ సహజ భాష ఇచ్చిన కంటెంట్‌లో ఉందో నిర్ణయించే సమస్య. ఈ సమస్యకు గణన విధానాలు దీనిని వివిధ గణాంక పద్ధతులతో పరిష్కరించబడిన టెక్స్ట్ వర్గీకరణ యొక్క ప్రత్యేక సందర్భంగా చూస్తాయి.

లాంగ్వేజ్ డిటెక్షన్ సేవలను వివిధ మార్గాల్లో ఉపయోగించవచ్చు, ఉదాహరణకు, చాట్ మరియు ఇమెయిల్ వంటి వ్యాపార గ్రంథాల భాషను గుర్తించడానికి వాటిని ఉపయోగించవచ్చు.
సేవ టెక్స్ట్ యొక్క భాషను మరియు భాష మారిన టెక్స్ట్ యొక్క భాగాలను వర్డ్ లెవల్ వరకు గుర్తించగలదు.
లాంగ్వేజ్ డిటెక్షన్ సేవలను ఉపయోగించి, నిఘా అంతర్దృష్టులు టెక్స్ట్‌లో ఉపయోగించే భాషను హైలైట్ చేయవచ్చు మరియు ఉల్లేఖించవచ్చు మరియు అనుమానాస్పద కార్యకలాపాలను గుర్తించడంలో సహాయపడతాయి.

ఇమెయిల్ లేదా చాట్ వంటి వ్యాపార గ్రంథాలు వివిధ భాషలలో ఉండవచ్చు. సహజ భాషా ప్రాసెసింగ్ పైప్‌లైన్‌లో కీలకభాగం ఏ భాష ప్రాథమిక భాష అని నిర్ణయించడం, తద్వారా ప్రతి టెక్స్ట్ సంబంధిత భాష-నిర్దిష్ట దశల ద్వారా ప్రాసెస్ చేయబడుతుంది.
కొన్ని సందర్భాల్లో, చట్టవిరుద్ధ కార్యకలాపాలను పర్యవేక్షించడం లేదా దాచడం వంటివి చేయకుండా ఉండటానికి వ్యక్తులు చాట్‌లలో ఉపయోగించే భాషను మార్చవచ్చు. అనుమానాస్పద కార్యకలాపం జరిగిందో లేదో తెలుసుకోవడానికి చాట్ భాష మారిన పాయింట్‌ను నిర్ణయించడం చాలా ఉపయోగకరంగా ఉంటుంది.

మీరు మా API ని ఉపయోగించాలనుకుంటే, క్లిక్ చేయడం ద్వారా దాని గురించి మరియు దాని ధరల గురించి మరింత సమాచారం పొందవచ్చు ఇక్కడ

API సేవను అందించడంతో పాటు, మేము దానిని ఓపెన్ సోర్స్‌గా విడుదల చేయాలని కూడా నిర్ణయించుకున్నాము.
ఇది మా మొదటి ఓపెన్ సోర్స్ విడుదల! లాంగ్వేజ్ డిటెక్టర్ ఓపెన్ సోర్స్, అందుబాటులో ఉంది ఇక్కడ