Wednesday, February 7, 2018

மெசின் லியர்னிங் அடிப்படைகள்:




மெசின் லீயர்னிங் என்பது உலகளாவிய அளவில் வளர்ந்து வரும் துறையாகும். இதில் ஏற்படும் முன்னேகற்றம் பல துறைகளில் மாற்றம் ஏற்படுத்தும். மெசின் லியர்னிங் ஏரியா ஆனது பல விதமான அல்கரிதங்களால் உட்பொதிக்கப்பட்டது.
மெசின் லீயர்னிங் என்பது என்ன?
மெசின் லீயர்னிங் என்பது கணினிகளை நிரலாக்கம் செய்யாலமேயே செயற்படுத்துதல் ஆகும். பொதுவாக மனிதனுக்கும் கணினிக்கும் உள்ள வித்தியாசம் மனிதன் கடந்த கால அனுபவம் மூலம் கற்றுக் கொள்கின்றான்.கணினிகள் நாம் என்ன செய்ய வேண்டும் என்று நிரலாக்கம் செய்கின்றோமோ அதைச் செய்யும்.
அதே போல் கணிகளையும் கடந்த கால அனுபவம் மூலம் கற்றுக் கொள்ள  வைப்பதே மெசின் லீயர்னிங் எனப்படும். இங்கே கடந்த கால அனுபவம் என்பது டேட்டாவைக் குறிக்கின்றது.
 மெசின் லியர்னிங் ஆனது அல்கரிதங்கள் மூலம் நடைமுறைப் படுத்தப் படுகின்றது. இந்த அல்கரிதம் ஆனது நாம் கொடுக்கும் இன்புட் டேட்டாவை வைத்து விளைவுகளை கணிக்கின்றது . நாம் எவ்வளவு அதிக டேட்டா இன்புட் கொடுக்கின்றோமோ  அந்தளவு ரிசல்ட்  துல்லிதமாக இருக்கும்.

இந்த அல்கரிதம்கள் மனிதனால் முடியாத அளவு கணக்கில் அடங்காத டேட்டாவை ப்ராசஸ் செய்யும். Big Data –வின் கண்டுபிடிப்பானது  மெசின் லியர்னிங் துறையில் மிக பெரிய அளவிலான டேட்டாக்களை பயன்பாட்டின் அடிப்படையில் பல வெற்றிகளை ஏற்படுத்தியுள்ளது.

ஒரு வழியில் மெசின் லியர்னிங் என்பது டேட்டா மைனிங்கை ஒத்ததாகும். இது கணிதத்தை அடிப்படையாக கொண்டது. இது  ஸ்டேடிக்கல் அனாலிசஸ்  மற்றும் இடெரேடிவ் லீயர்னிங் அகியவற்றுடன் தொடர்பு கொண்டது.


மெசின் லியர்னிங்கை பயன்படுத்தும் நிரல்கள்
இது ஸ்பாம் இ மெயிலை கண்டுபிடிக்க உதவுகின்றது.
வெப் சியர்ச் எஞ்சின்கள்.
இமேஜ் மற்றும் ஸ்பீச் ரெகக்னிசன்
மெடிகல் டயகனிஸ்
மெசின் லியர்னிங் உத்திகள்:
இது மூன்று வகையான உத்திகளைக் கையாளுகின்றது. இந்த டேட்டா மாடல்களை கட்டமைக்க உதவுகின்றது. இதன் மூலம் ஸ்டாக் ஹோல்டர்கள் வணிக ரீதியான முடிவுகளை எடுக்கலாம்.
1.  சூப்பர்வைஸ்டு லியர்னிங்
2.  அன்சூப்பர்வைஸ்டு லியர்னிங்.
3.  ரீ இன்ஃபோர்ஸ்மென்ட் லியர்னிங்.
சூபர்வைஸ்டு லியர்னிங்:
 இது பொதுவாக அனேகம் பேர் பயன்படுத்தும் லியர்னிங் ஆகும். இந்த வகையான அல்கரிதத்தில் ட்ரைனிங் டேட்டாவைப் பயன்படுத்தி உள்ளீட்டுக்கும் வெளியீட்டிற்க்கும் உள்ள தொடர்பை கண்டுபிடிக்கின்றது. இது கொடுக்கப்பட்ட உள்ளீடு, வெளியீடு ஆகியவற்றை அடிப்படையாகக் கொண்டு புதிய உள்ளீடுகளை கணிக்கும் திறன் கொண்டது. இங்கே ட்ரைனிங் டேட்டாசெடானது மெசினை பயிற்றுவிக்கின்றது. இந்த ,மாடலானது பெரும்பாலும் இமேஜ் ரெகனிசன் மற்றும் ஸ்பீச் ரெகனிசன் ஆகியவற்றில் பயன்பாடுகின்றது.
சூபர்வைஸ்டு லியர்னிங் ஆனது பின் வரும் வகையான அல்கரிதம்களை கொண்டது
1.  Classification
2.  Regression


Classification
இந்த மாடலானது இன்புட் டேட்டாக்களை கேட்டகரிகளாக வகைப்படுத்துகின்றது
Regression:
ரிக்ரசன் ப்ராபளம் ஆனது அவுட் புட் வேரியபிள் ரியல் மற்றும் தொடர்ச்சியான மதிப்பாக(உதாரணமாக ‘SALARY’  அல்லது ‘WEIGHT) இருத்தல் ஆகும் பலவிதமான மாடல்களை பயன்படுத்தலாம் எனினும் லீனிரை ரிக்ரசன் தான் எளியதாகும்.
அன்சூபர்வைஸ்டு லீயர்னிங்:
இது டேட்டாவில் பொதித்து வைக்கப் பட்ட பேட்டர்ன்களை கண்டுபிடிக்க பயன்படுகின்றது.  இந்த அல்கரிதத்தில் நம்மிடம்   ரிசல்டை கணிக்கும் அவுட்புட் மற்றும் டார்கெட் ஏதும் கிடையாது. இதை ஏன் அன்சூபர்வைஸ்டு லியர்னிங் என்று அழைக்கின்றோம் என்றால்இவை தானாக கொடுக்கப்பட்ட டேட்டாவை ஆய்வு செய்து ஸ்பெசிக் ஸ்ட்ரக்சர் அல்லது பேட்டர்களை கண்டுபிடிக்கின்றது.
 இதில் பயன்படும் அல்கரிதம்கள்:
1.  Clustering
2.  Association Rules.
Clustering.
இது அப்ஜெக்ட் செட்களை குரூப் செய்து அவ்ற்றிற்கு இடையே ஏதும் தொடர்பு இருக்கின்றதா என கண்டுபிடிக்கின்றது.
Association Rules(pattern detection)
இது விதிமுறை சார்ந்த மெசின் லியர்னிங் ஆகும் இவை பெரிய டேட்டாபேஸ்களில் உள்ள வேரியபிள்கிடையே உள்ள தொடர்புகளை கண்டுபிடிக்க உதவுகின்றது.
Reinforcement Learning
இந்த வகையான அல்கரிதம் கணினியால் எடுக்கப்பட்ட தீர்மானங்கள் சரியானது தானா என்று சொல்கின்றது. போதுமான இடரேசன்களில் வெளீயீட்டை கணித்துச் சொல்கின்றது.
மெசின் லியர்னிங்கில் பயன் படும் பொதுவான அல்கரிதம்கள்:
  • Linear Regression
  • Naive Bayes Algorithms
  • Decision Tree Algorithms
  • Gradient Descent
  • Neural Network
  • Deep Learning Algorithms
  • K-Means
  • KNN (K – Nearest Neighbors)
  • Q Learning
  • SVM (Support Vector Machine)
அல்காரிதத்தை தேர்ந்தெடுத்தல்:
கொடுக்கப்பட்ட் ப்ராபளமிற்கு எந்த வகையான அல்கரிததை பயன்படுத்தலாம் என்று தேர்ந்தெடுத்தல் கடிதமானது ஆகும். சில சமயங்களில் ட்ரையல் மற்றும் எர்ரர் மெதட்கள் பின்பற்றப்படுகின்றது.சில சமயங்களில் அல்கரிதம் தேர்ந்தெடுத்தல் டேட்டாவின் வகை மற்றும் அளவு ஆகியவற்றின் அடிப்படையில் அமைகின்றது. எப்பொழுது பெரிய அளவிலான மற்றும் சிக்கலான செயல்கள் இருகின்றதோ அப்போது மெசின் லியர்னிங்கிற்கு செல்லலாம்.
வாய்ப்புகள்:
கூகிள், ஆப்பிள், மைக்ரோசாஃப்ட் மற்றும் அமேசான் போன்ற நிறுவனங்கள் மெசின் லியர்னிங் ஆய்வுகளில் பெரிய அளவிலான முதலீடு செய்து வருகின்றது. வரும் வருடங்களில் மெசின் லியர்னிங்கில் பெரிய வாய்ப்புகளை எதிர்பார்க்கலாம். ஆகவே பைத்தான் அல்லது ஆர் மொழிகளில் டிசைன் அல்கரிதத்தை கற்பது நல்லதாகும்.
மெசின் லியர்னிங்கில் பயன்படும் மொழிகள்:
மெசின் லியர்னிங் நடைமுறைப் படுத்த நிறைய மொழிகள் இருந்தாலும் பின் வரும் இரண்டு மொழிகள் பரவலாக பயன்படுத்தப் படுகின்றன:
பைத்தான்:
  • மெசின் லியர்னிங்கை பயில துவங்குதற்கு பைத்தான் மொழியை கற்றல் நல்லதாகும். பைத்தான் மொழி பயிலுவதற்கு எளியதாகும். இதில் சில நல்ல மெசின் லியர்னிங் லைப்ரரிகள்(scikit-learn, pyML, and pybrain.) உள்ளன.
  • ஆர்:
இது ஒரு ஓபன் சோர்ஸ் மொழியாகும். இதன் சிண்டாக்ஸ் எளியது அல்ல என்றாலும் இதை கற்று வைத்துக் கொள்தல் உபயோகமானதாகும்.
-முத்து கார்த்திகேயன்,மதுரை.
ads Udanz

No comments:

Post a Comment