කථන හඳුනාගැනීමේදී කෘතිම බුද්ධියේ සහ යන්ත්‍ර ඉගෙනීමේ කාර්යභාරය

කථන හඳුනාගැනීමේදී කෘතිම බුද්ධියේ සහ යන්ත්‍ර ඉගෙනීමේ කාර්යභාරය

බොහෝ කලක සිට මිනිසුන්ට යන්ත්‍ර සමඟ කතා කිරීමට අවශ්‍ය විය. ඔවුන් පරිගණක තැනීම ආරම්භ කළ දා සිට විද්‍යාඥයන් සහ ඉංජිනේරුවන් කථන හඳුනාගැනීම ක්‍රියාවලියට ඇතුළත් කිරීමට උත්සාහ කර ඇත. 1962 වර්ෂයේදී IBM විසින් Shoebox, සරල ගණිත ගණනය කිරීම් කළ හැකි කථන හඳුනාගැනීමේ යන්ත්‍රයක් හඳුන්වා දෙන ලදී. මෙම නව්‍ය උපාංගය “0” සිට “9” දක්වා ඉලක්කම් දහය ඇතුළුව කතා කරන වචන 16ක් හඳුනාගෙන ඒවාට ප්‍රතිචාර දැක්වීය. “plus,” “minus” සහ “total” වැනි සංඛ්‍යා සහ විධාන වචන කථා කළ විට, Shoebox සරල අංක ගණිත ගැටලුවලට පිළිතුරු ගණනය කිරීමට සහ මුද්‍රණය කිරීමට එකතු කිරීමේ යන්ත්‍රයකට උපදෙස් දුන්නේය. සපත්තු පෙට්ටිය ක්‍රියාත්මක වූයේ මයික්‍රෆෝනයකට කථා කිරීමෙනි, එය හඬ ශබ්ද විද්‍යුත් ආවේගයන් බවට පරිවර්තනය කරයි. මිනුම් පරිපථයක් මෙම ආවේගයන් විවිධ ආකාරයේ ශබ්ද අනුව වර්ග කර රිලේ පද්ධතියක් හරහා අමුණා ඇති එකතු කිරීමේ යන්ත්‍රය සක්‍රීය කළේය.

කාලයාගේ ඇවෑමෙන්, මෙම තාක්ෂණය දියුණු වූ අතර අද අපගෙන් බොහෝ දෙනෙක් කටහඬින් පිටත පරිගණක සමඟ කටයුතු කරති. අද ජනප්‍රියම හඬ සහායකයින් වන්නේ Alexa by Amazon, Siri by Apple, Google Assistant සහ Cortana Microsoft වෙතින්. මෙම සහායකයින්ට විධාන හෝ ප්‍රශ්න මත පදනම්ව පුද්ගලයෙකු සඳහා කාර්යයන් හෝ සේවා සිදු කළ හැක. ඔවුන්ට මිනිස් කථනය අර්ථකථනය කිරීමට සහ සංස්ලේෂණය කළ කටහඬවල් හරහා ප්‍රතිචාර දැක්වීමට හැකියාව ඇත. පරිශීලකයින්ට ඔවුන්ගේ සහායකයන්ගෙන් ප්‍රශ්න ඇසීමට, හඬ හරහා නිවෙස් ස්වයංක්‍රීය උපාංග සහ මාධ්‍ය නැවත ධාවනය පාලනය කිරීමට සහ වාචික විධාන සමඟ ඊමේල්, කළ යුතු දේ ලැයිස්තු සහ දින දර්ශන වැනි අනෙකුත් මූලික කාර්යයන් කළමනාකරණය කළ හැකිය. කෘතිම බුද්ධිය (AI) සහ යන්ත්‍ර ඉගෙනීම මත රඳා පවතී.

කෘතිම බුද්ධිය (AI)

1

කෘත්‍රිම බුද්ධිය (AI) කිව්වම ගොඩක් අය හිතන්න පුළුවන් ඔයා කතා කරන්නේ විද්‍යා ප්‍රබන්ධ ගැන කියලා, AI අපේ එදිනෙදා ජීවිතයට ගොඩක් කාවැදී තිබුණත්. ඇත්ත වශයෙන්ම, එය දශක ගණනාවක් තිස්සේ පැවතුනි. නමුත් සත්‍යය නම්, 20 වැනි සියවසේ ආරම්භයේ දී කෘත්‍රිම බුද්ධියෙන් යුත් මිනිසුන්ට සමාන රොබෝවරුන් පිළිබඳව මහජනතාවට හුරුපුරුදු වූයේ විද්‍යා ප්‍රබන්ධයකි. 50 දශකයේ දී AI පිළිබඳ සංකල්ප වැඩි වැඩියෙන් විද්‍යාඥයින්ගේ සහ දාර්ශනිකයන්ගේ අවධානයට ලක් විය. එකල තරුණ බ්‍රිතාන්‍ය ගණිතඥ ඇලන් ටියුරින් යෝජනා කළේ යන්ත්‍රවලට (මිනිසුන්ට මෙන්) ගැටලු විසඳීමට සහ පවතින තොරතුරු මත පදනම්ව තීරණ ගැනීමට නොහැකි වීමට හේතුවක් නොමැති බවයි. නමුත් ඒ කාලයේ බුද්ධියට මූලික වන කටපාඩම් කිරීමේ හැකියාවක් පරිගණකවලට තිබුණේ නැත. ඔවුන් කළේ විධාන ක්‍රියාත්මක කිරීම පමණයි. එහෙත් තවමත්, කෘතිම බුද්ධියේ මූලික ඉලක්කය සහ දැක්ම ස්ථාපිත කළේ ඇලන් ටියුරින් ය.

කෘතිම බුද්ධිය යන පදය නිර්මාණය කළ ජෝන් මැකාති AI හි පියා ලෙස පුළුල් ලෙස පිළිගැනේ. ඔහුට AI යනු: "බුද්ධිමත් යන්ත්‍ර සෑදීමේ විද්‍යාව සහ ඉංජිනේරු විද්‍යාව". මෙම නිර්වචනය 1956 දී Dartmouth විද්‍යාලයේ පැවති සම්මන්ත්‍රණයකදී ඉදිරිපත් කරන ලද අතර එය AI පර්යේෂණයේ ආරම්භය පෙන්නුම් කළේය. එතැන් සිට AI දියුණු විය.

නූතන ලෝකයේ කෘතිම බුද්ධිය සෑම තැනකම පවතී. දත්ත පරිමාව වැඩි කිරීම, උසස් ඇල්ගොරිතම සහ පරිගණක බලය සහ ගබඩා කිරීමේ වැඩිදියුණු කිරීම් හේතුවෙන් එය වඩාත් ජනප්‍රිය වී ඇත. බොහෝ විට AI යෙදුම බුද්ධිමය කාර්යයන් සමඟ සම්බන්ධ වේ. පරිවර්තනය, වස්තුව, මුහුණ සහ කථන හඳුනාගැනීම, මාතෘකා හඳුනාගැනීම, වෛද්‍ය රූප විශ්ලේෂණය, ස්වාභාවික භාෂා සැකසීම, සමාජ ජාල පෙරීම, චෙස් ක්‍රීඩා ආදිය සඳහා අපි AI භාවිතා කරමු.

යන්ත්‍ර ඉගෙනීම

යන්ත්‍ර ඉගෙනීම යනු කෘත්‍රිම බුද්ධියේ යෙදුමක් වන අතර එය තමන්ගේම අත්දැකීම් වලින් දියුණු වීමට හැකියාව ඇති පද්ධති වෙත යොමු කරයි. මෙහි ඇති වැදගත්ම දෙය නම් පද්ධතිය රටා හඳුනා ගන්නේ කෙසේදැයි දැන සිටිය යුතුය. එය සිදු කිරීමට පද්ධතිය පුහුණු කළ යුතුය: ඇල්ගොරිතම විශාල දත්ත ප්‍රමාණයක් පෝෂණය කරයි, එබැවින් යම් අවස්ථාවක රටා හඳුනා ගැනීමට හැකි වේ. ඉලක්කය වන්නේ මිනිසාගේ මැදිහත් වීමකින් හෝ උපකාරයකින් තොරව පරිගණකවලට ස්වයංක්‍රීයව ඉගෙනීමට ඉඩ සැලසීමයි.

යන්ත්‍ර ඉගෙනීම ගැන කතා කරන විට, ගැඹුරු ඉගෙනීම ගැන සඳහන් කිරීම වැදගත්ය. ගැඹුරු ඉගෙනීමේදී භාවිතා කරන ප්‍රධාන මෙවලමක් කෘතිම ස්නායුක ජාල බව කියමින් ආරම්භ කරමු. ඒවා ස්ථිතික සහ සංකේතාත්මක වීමට නැඹුරු වුවද, ජීව විද්‍යාත්මක මොළය මෙන් ප්ලාස්ටික් සහ ප්‍රතිසම නොවන නමුත් මොළයේ ව්‍යුහය සහ ක්‍රියාකාරිත්වය මගින් දේවානුභාවයෙන් ඇති ඇල්ගොරිතම වේ. එබැවින් ගැඹුරු ඉගෙනීම යනු කෘත්‍රිම ස්නායුක ජාලය මත පදනම් වූ විශේෂිත යන්ත්‍ර ඉගෙනීමේ ක්‍රමයක් වන අතර එහි අරමුණ මිනිසුන් ඉගෙන ගන්නා ආකාරය ප්‍රතිනිර්මාණය කිරීම වන අතර මෙය ක්‍රමලේඛකයෙකුට යන්ත්‍රය ඉගැන්වීමට නොහැකි තරම් රටා සෙවීමට විශිෂ්ට මෙවලමක් ලෙස ක්‍රියා කරයි. පසුගිය වසර කිහිපය තුළ රියදුරු රහිත මෝටර් රථ සහ ඒවා අපගේ ජීවිත වෙනස් කළ හැකි ආකාරය ගැන බොහෝ දේ කතා කර ඇත. ගැඹුරු ඉගෙනුම් තාක්‍ෂණය මෙහි ප්‍රධාන වේ, මන්ද එය පදිකයෙකු ගිනි නිවන ද්‍රව්‍යයකින් වෙන්කර හඳුනා ගැනීමට හෝ රතු එළියක් හඳුනා ගැනීමට මෝටර් රථයට හැකියාව ලබා දීමෙන් අනතුරු අඩු කරයි. ටැබ්ලට්, දුරකථන, ෆ්‍රිජ්, ටීවී වැනි උපාංගවල කටහඬ පාලනය කිරීමේදී ගැඹුරු ඉගෙනුම් තාක්‍ෂණය ප්‍රධාන කාර්යභාරයක් ඉටු කරයි. ඊ-වාණිජ්‍ය සමාගම් බොහෝ විට කෘත්‍රිම ස්නායුක ජාල භාවිත කරන්නෙකුට අවශ්‍ය අයිතම අනාවැකි පළ කිරීමට උත්සාහ කරන පෙරීමේ පද්ධතියක් ලෙස භාවිතා කරයි. මිලදී ගන්න. ගැඹුරු ඉගෙනීමේ තාක්ෂණය වෛද්‍ය ක්ෂේත්‍රයේ ද භාවිතා වේ. එය පිළිකා පර්යේෂකයන්ට පිළිකා සෛල ස්වයංක්‍රීයව හඳුනා ගැනීමට උපකාර වන අතර එමඟින් පිළිකා ප්‍රතිකාරයේ දැවැන්ත ප්‍රගතියක් නියෝජනය කරයි.

කථන හඳුනාගැනීම

කථන හඳුනාගැනීමේ තාක්ෂණය කථන භාෂාවේ වචන සහ වාක්‍ය ඛණ්ඩ හඳුනා ගැනීමට සහ ඒවා යන්ත්‍රය සඳහා කියවිය හැකි ආකෘතියක් බවට පරිවර්තනය කිරීමට සේවය කරයි. සමහර වැඩසටහන් වලට සීමිත වාක්‍ය ඛණ්ඩ සංඛ්‍යාවක් පමණක් හඳුනාගත හැකි අතර, තවත් සමහර සංකීර්ණ කථන හඳුනාගැනීමේ වැඩසටහන් වලට ස්වභාවික කථනය විකේතනය කළ හැක.

ජය ගැනීමට බාධා තිබේද?

පහසු වන අතර, කථන හඳුනාගැනීමේ තාක්ෂණය සෑම විටම සුමටව සිදු නොවන අතර එය අඛණ්ඩව සංවර්ධනය කර ඇති බැවින්, එය විසඳා ගැනීමට ගැටළු කිහිපයක් තිබේ. පැන නගින ගැටළු වලට පහත සඳහන් දෑ ඇතුළත් විය හැකිය: පටිගත කිරීමේ ගුණාත්මක භාවය ප්‍රමාණවත් නොවිය හැකිය, කථිකයා තේරුම් ගැනීමට අපහසු වන පසුබිමේ ශබ්ද තිබිය හැකිය, එසේම කථිකයාට ඇත්ත වශයෙන්ම ප්‍රබල උච්චාරණයක් හෝ උපභාෂාවක් තිබිය හැකිය (ඔබද? කවදා හෝ Geordie උපභාෂාව අසා තිබේද?), ආදිය.

කථන හඳුනාගැනීම බොහෝ දුරට වර්ධනය වී ඇත, නමුත් එය තවමත් පරිපූර්ණ වීමට වඩා බොහෝ දුරස් ය. සෑම දෙයක්ම වචන පමණක් නොවේ, යන්ත්‍රයට තවමත් මිනිසුන්ට කළ හැකි බොහෝ දේ කළ නොහැක: ඔවුන්ට ශරීර භාෂාව කියවීමට හෝ යමෙකුගේ කටහඬේ උපහාසාත්මක ස්වරය හඳුනාගත නොහැක. මිනිසුන් බොහෝ විට සෑම වචනයක්ම නිසි ආකාරයෙන් උච්චාරණය නොකරන අතර ඔවුන් සමහර වචන කෙටි කිරීමට නැඹුරු වෙති. නිදසුනක් වශයෙන්, වේගයෙන් සහ අවිධිමත් ලෙස කථා කරන විට, ස්වදේශික ඉංග්‍රීසි කතා කරන්නන් බොහෝ විට "gonna" ලෙස "gonna" ලෙස උච්චාරණය කරයි. ඉහත සියල්ල, ඔවුන් ජය ගැනීමට උත්සාහ කරන යන්ත්‍ර සඳහා බාධක ඇති කරයි, නමුත් ඒවා ඉදිරියෙන් තවමත් බොහෝ දුරක් ඇත. එම විශේෂිත ඇල්ගොරිතම වෙත වැඩි වැඩියෙන් දත්ත සංග්‍රහ වන බැවින් ඉස්මතු කිරීම වැදගත් වේ; අභියෝග අඩු වන බව පෙනේ. ස්වයංක්‍රීය කථන හඳුනාගැනීමේ අනාගතය දීප්තිමත් බව පෙනේ.

කටහඬ බලයෙන් ක්‍රියාත්මක වන පරිශීලක අතුරුමුහුණත් වැඩි වැඩියෙන් ලබා ගත හැකි අතර ගෘහස්ථයන් තුළ ජනප්‍රිය වෙමින් පවතී. එය තාක්‍ෂණයේ මීළඟ වේදිකාව බවට පත් විය හැකිය.

Gglot ස්වයංක්‍රීය පිටපත් කිරීමේ සේවා ආකාරයෙන් ස්වයංක්‍රීය කථන හඳුනාගැනීමක් ලබා දෙයි - අපි කථන පෙළ බවට පරිවර්තනය කරමු. අපගේ සේවාව භාවිතා කිරීමට සරලයි, එය ඔබට විශාල මුදලක් වැය නොවන අතර එය ඉක්මනින් සිදු කරනු ඇත!