ஸ்மோடின் அதன் புதிய வெளியீட்டை அறிவிக்கிறது மொழி கண்டறிதல் API 176 மொழிகளை ஆதரிக்கிறது

எங்கள் பயன்பாடுகளை மேம்படுத்த ஒரு மொழி கண்டுபிடிப்பான் தேவை என்பதால், நாங்கள் ஒரு தீர்வைக் கண்டுபிடிக்க முடிவு செய்துள்ளோம்.

முதலில், கூகிள் அதை மிகவும் எளிதாக்கும் என்பதால், இது எளிதானது என்று நாங்கள் நினைத்தோம், ஆனால் நாங்கள் கண்டறிந்தபடி, இது எளிதான பணி அல்ல, மாறாக, மொழி கண்டறிதல் எப்போதும் கடினமான பணியாகும்.

ஒரு பெரிய இயந்திர கற்றல் மாதிரி தேவையில்லாத உரையிலிருந்து ஒரு மொழியைக் கணிப்பதற்கான சிறந்த விருப்பத்திற்கான தேடலில், சிறந்த தீர்வு 1MB க்கும் குறைவான நினைவகத்தை எடுக்கும் முன் பயிற்சி பெற்ற மொழி அடையாள மாதிரியாகும். வினாடிக்கு ஆயிரக்கணக்கான ஆவணங்களை வகைப்படுத்தவும்.

பல மாற்றங்கள் மற்றும் மேம்பாடுகளுக்குப் பிறகு, ஒவ்வொரு மொழிக்கும் நல்ல துல்லியமான விகிதங்களை நம்பிக்கையுடன் வழங்கக்கூடிய ஒரு கருவியை நாங்கள் உருவாக்கியுள்ளோம்.

நல்ல துல்லியமான மதிப்பீடுகளை வழங்குதல், அது மட்டுமல்லாமல் வேகமான மற்றும் நம்பகமான வேகத்திலும். ஒரு நாட்டிற்கான துல்லியமான பட்டியல் இங்கே.

99% துல்லியமான மொழி* , எஸ்பெராண்டோ (eo), போலந்து (pl), பின்னிஷ் (fi), ரஷியன் (ru), மாசிடோனியன் (mk), உக்ரேனிய (uk), லிதுவேனியன் (lt), வியட்நாமீஸ் (vi), கிரேக்கம் (el), மராத்தி (திரு) , அரபு (ar), ஹீப்ரு (he), இந்தி (hi), உய்கூர் (ug), ஜப்பானிய (ja), ஜார்ஜியன் (ka), பெங்காலி (bn), உருது (ur), தாய் (th), சீன (zh) , ஆர்மேனியன் (ஹை), மலையாளம் (மிலி), கொரியன் (கோ), கெமர் (கிமீ), பர்மீஸ் (என்), தமிழ் (ட), கன்னடா (க்என்), தெலுங்கு (தே), பஞ்சாபி (பா), லாவோ (லோ) , குஜராத்தி (gu), திபெத்திய தரநிலை (போ), திவேஹி (dv), சிங்களம் (si), அம்ஹாரிக் (am).

90% துல்லியமான மொழிகள்*: டேனிஷ் (da), ருமேனியன் (ro), ஸ்வீடிஷ் (sv), லத்தீன் (la), பல்கேரியன் (bg), செக் (cs), டாகலாக் (tl), இந்தோனேசிய (id), டாடர் (tt) , ஐஸ்லாந்து ஒசெட்டியன் (ஓஎஸ்), தாஜிக் (டிஜி).

*பெரும்பாலான சோதனை தரவுகளின் வரிசையில் தகவல் வழங்கப்படுகிறது. தரவு 30-250 எழுத்துகளின் நீளம் கொண்ட வாக்கியங்கள். சோதனை மிகவும் பிரபலமான 100 மொழிகளில் மட்டுமே செய்யப்பட்டது. 99 எழுத்துகளுக்கு மேல் அல்லது அதற்கு மேற்பட்ட வாக்கியங்களுக்கு 300% துல்லியத்தை சோதனை காட்டுகிறது.

நீங்கள் சரியான முடிவுகளைப் பெற முடியாவிட்டாலும், சிறந்த துல்லியம் (99%+ பல மொழிகளுக்கு, குறைவாக அறியப்பட்டவை கூட) 300 எழுத்துக்கள் அல்லது அதற்கு மேல் காணப்படுகிறது. உரை நீளத்தைப் பொருட்படுத்தாமல், நீண்டது சிறந்தது.

விக்கி குறிப்பிடுவது போல்: மொழி அடையாளம் காணல் அல்லது மொழி யூகிப்பது எந்த இயற்கை மொழியில் உள்ளடக்கம் உள்ளது என்பதை தீர்மானிப்பதில் உள்ள பிரச்சனை. இந்த சிக்கலுக்கான கணக்கீட்டு அணுகுமுறைகள் இது பல்வேறு வகைப்பட்ட புள்ளிவிவர முறைகளால் தீர்க்கப்பட்ட உரை வகைப்படுத்தலின் சிறப்பு நிகழ்வாக பார்க்கிறது.

மொழி கண்டறிதல் சேவைகள் பல்வேறு வழிகளில் பயன்படுத்தப்படலாம், எடுத்துக்காட்டாக, அரட்டை மற்றும் மின்னஞ்சல் போன்ற வணிக நூல்களின் மொழியை அடையாளம் காண அவை பயன்படுத்தப்படலாம்.
இந்த சேவை உரையின் மொழி மற்றும் மொழி மாறிய உரையின் பகுதிகளை வார்த்தை நிலை வரை அடையாளம் காண முடியும்.
மொழி கண்டறிதல் சேவைகளைப் பயன்படுத்தி, கண்காணிப்பு நுண்ணறிவுகள் உரையில் பயன்படுத்தப்படும் மொழியை முன்னிலைப்படுத்தி, சிறுகுறிப்பு மற்றும் சந்தேகத்திற்கிடமான செயல்பாடுகளை அடையாளம் காண உதவும்.

மின்னஞ்சல் அல்லது அரட்டை போன்ற வணிக நூல்கள் வெவ்வேறு மொழிகளில் இருக்கலாம். இயற்கையான மொழி செயலாக்க குழாயின் ஒரு முக்கிய பகுதி எந்த மொழி முதன்மை மொழி என்பதை தீர்மானிப்பதால் ஒவ்வொரு உரையும் தொடர்புடைய மொழி சார்ந்த படிகள் மூலம் செயலாக்கப்படும்.
சில சமயங்களில், சட்டவிரோத நடவடிக்கைகளைக் கண்காணிப்பதையோ அல்லது மறைப்பதையோ தவிர்க்க, அரட்டைகளில் பயன்படுத்தப்படும் மொழியை மக்கள் மாற்றலாம். சந்தேகத்திற்கிடமான செயல்பாடு நடந்துள்ளதா என்பதைத் தீர்மானிக்க, அரட்டை மொழி மாற்றப்படும் புள்ளியைத் தீர்மானிப்பது மிகவும் பயனுள்ளதாக இருக்கும்.

நீங்கள் எங்கள் API ஐப் பயன்படுத்த விரும்பினால், கிளிக் செய்வதன் மூலம் அதன் விலை மற்றும் அதன் விலை பற்றிய கூடுதல் தகவலைப் பெறலாம் இங்கே

ஏபிஐ சேவையை வழங்குவதைத் தவிர, அதை திறந்த மூலமாகவும் வெளியிட முடிவு செய்துள்ளோம்.
இது எங்கள் முதல் திறந்த மூல வெளியீடு! மொழி கண்டறிதல் திறந்த மூல, கிடைக்கிறது இங்கே