የንግግር እውቅና በትክክል ምንድን ነው?
የንግግር ማወቂያ
ስለ ንግግር ማወቂያ ማወቅ ያለብዎት
ስለ ንግግር ማወቂያ ስንናገር ብዙውን ጊዜ የምንናገረው ሶፍትዌር ማለት የተነገረውን ቃል የመለየት እና በፕሮግራም ውስጥ የመፃፍ ችሎታ ስላለው በመጨረሻ የተነገረውን ሁሉ በጽሑፍ ቅርጸት እንዲኖርዎት ነው። እሱም ብዙውን ጊዜ "ንግግር-ወደ-ጽሑፍ" ተብሎ ይጠራል. መጀመሪያ ላይ ሶፍትዌሩ በጣም የተገደበ እድሎች ነበሩት ስለዚህም የተወሰነ ቁጥር ያላቸውን ሀረጎች ብቻ መቀየር ይችላሉ። ከጊዜ በኋላ የንግግር ለይቶ ማወቂያ ሶፍትዌር ቴክኖሎጂው ብዙ እየዳበረ መጥቷል እና አሁን በጣም የተራቀቀ ነው, ስለዚህም የተለያዩ ቋንቋዎችን አልፎ ተርፎም የተለያዩ ዘዬዎችን መለየት ይችላል. ግን በእርግጥ በዚህ መስክ አሁንም መሠራት ያለበት ሥራ አለ።
ምንም እንኳን አንዳንድ ጊዜ ሰዎች ሁለቱን ቃላት ለተመሳሳይ ነገር ቢጠቀሙም የንግግር ማወቂያ ከድምፅ ማወቂያ ጋር አንድ አይነት አለመሆኑን ልብ ማለት ያስፈልጋል። የድምጽ ማወቂያ የሚናገረውን ሰው ለመለየት እንጂ የሚናገረውን ላለማስተዋል ነው።
የንግግር ማወቂያ እና ተዛማጅ ቴክኖሎጂ አጭር ታሪክ
በዚህ ጽሑፍ ውስጥ የንግግር ማወቂያን መነሳት ታሪክ እና ቴክኖሎጂን በአጭሩ እናብራራለን.
ከዲጂታል ዘመን መባቻ ጀምሮ ሰዎች እንደምንም ከማሽን ጋር መገናኘት እንዲችሉ ፍላጎት ነበራቸው። የመጀመሪያው ዓይነት ዲጂታል ኮምፒዩተር ከተፈለሰፈ በኋላ፣ በርካታ ሳይንቲስቶች እና መሐንዲሶች የንግግር እውቅናን በዚህ ሂደት ውስጥ ተግባራዊ ለማድረግ በተለያዩ መንገዶች ሞክረዋል። የዚህ ሂደት ወሳኝ አመት 1962 ነበር፣ IBM ቀላል የሂሳብ ስሌቶችን መስራት የሚችል መሰረታዊ የንግግር ማወቂያ ማሽን ሾቦክስን ሲገልጥ ነበር። የዚህ ፕሮቶ ኮምፒውተር ተጠቃሚ ወደ ማይክሮፎን ከተነጋገረ፣ ይህ ማሽን እንደ "ፕላስ" ወይም "መቀነስ" ያሉ እስከ ስድስት የሚደርሱ የቁጥጥር ቃላትን ማወቅ ችሏል። ከጊዜ በኋላ ከዚህ በስተጀርባ ያለው ቴክኖሎጂ አዳብሯል እና ዛሬ ከኮምፒዩተሮች ጋር በድምጽ መገናኘት በጣም የተለመደ ባህሪ ነው። እንደ Siri ወይም Alexa ያሉ ብዙ ታዋቂ የንግግር ማወቂያ ሞተሮች አሉ። እነዚህ በድምጽ የሚነዱ መሳሪያዎች በአርቴፊሻል ኢንተለጀንስ (AI) እና በማሽን መማር ላይ የተመሰረቱ መሆናቸውን ልብ ማለት ያስፈልጋል።
አርቴፊሻል ኢንተለጀንስ (AI) ሲጠቀስ ከሳይንስ ልቦለድ ፊልም ላይ ያለ ነገር ሊመስል ይችላል፣ እውነታው ግን ዛሬ ባለንበት ዘመን AI በዓለማችን ላይ ትልቅ ሚና ይጫወታል። እንደ እውነቱ ከሆነ ብዙ ፕሮግራሞች እና አፕሊኬሽኖች አስቀድመው ስለሚጠቀሙበት AI በዕለት ተዕለት ሕይወታችን ውስጥ በጣም ይገኛል. ነገር ግን ይህ ቃል በ 20 ኛው ክፍለ ዘመን መጀመሪያ ላይ የሳይንስ ልብ ወለድ ነበር. እ.ኤ.አ. በ 1950 መገባደጃ ላይ የ AI ፅንሰ-ሀሳቦች የበለጠ ታዋቂ እና የብዙ ሳይንቲስቶች እና ፈላስፋዎች ትኩረት ነበሩ። በዚያን ጊዜ፣ አለን ቱሪንግ የተባለ አንድ በጣም ትልቅ ሥልጣን ያለው ብሪቲሽ የሒሳብ ሊቅ፣ ማሽኖቹ ባሉበት መረጃ ላይ በመመስረት ችግሮችን መፍታት እንደሚችሉ እና በራሳቸው ውሳኔ እንዲወስኑ ሐሳብ አቀረበ። ችግሩ ኮምፒውተሮች ያንን መረጃ የማስታወስ እድላቸው ገና ስላልነበረው ለአርቴፊሻል ኢንተለጀንስ እድገት ወሳኝ እርምጃ ነው። ያኔ ማድረግ የሚችሉት ቀላል ትዕዛዞችን ማስፈጸም ብቻ ነበር።
በ AI እድገት ውስጥ ሌላው አስፈላጊ ስም ጆን ማካርቲ ነው, እሱም በመጀመሪያ "ሰው ሰራሽ የማሰብ ችሎታ" የሚለውን ቃል የፈጠረው. McCarthy AI ነው ብለዋል: "የማሰብ ችሎታ ማሽኖች የመሥራት ሳይንስ እና ምህንድስና". ይህ ፍቺ በ1956 በዳርትማውዝ ኮሌጅ በተደረገ የሴሚናል ኮንፈረንስ ላይ ታየ። ከዚያን ጊዜ ጀምሮ AI በከፍተኛ ፍጥነት ማደግ ጀመረ።
ዛሬ አርቴፊሻል ኢንተለጀንስ በተለያየ መልኩ በየቦታው ይገኛል። በጅምላ ወደ ጉዲፈቻ (ጉዲፈቻ) አድጓል ይህም በዋነኛነት በአለም አቀፍ ደረጃ በየቀኑ እየተለዋወጠ ያለው አጠቃላይ የመረጃ መጠን በመጨመሩ ነው። በላቁ ስልተ ቀመሮች ውስጥ ጥቅም ላይ ይውላል፣ እና በማከማቻ እና በኮምፒዩተር ሃይል ላይ ማሻሻያዎችን አስገኝቷል። AI ለብዙ ዓላማዎች ጥቅም ላይ ይውላል, ለምሳሌ ለትርጉም, ለጽሑፍ ቅጂ, ለንግግር, ለፊት እና ለዕቃዎች መለየት, የሕክምና ምስሎችን ትንተና, የተፈጥሮ ቋንቋዎችን ማቀናበር, የተለያዩ የማህበራዊ አውታረ መረቦች ማጣሪያዎች እና ሌሎችም. ያንን የቼዝ ግጥሚያ በአያት ጋሪ ካስፓሮቭ እና በዲፕ ሰማያዊ ቼዝ AI መካከል ያስታውሱ?
የማሽን መማር ሌላ በጣም ጠቃሚ የሰው ሰራሽ የማሰብ አተገባበር ነው። በአጭሩ፣ ከራሳቸው ልምድ የውሂብ ጎታ የመማር እና የማሻሻል ችሎታ ያላቸውን ማናቸውንም ስርዓቶች ይመለከታል። ይህ የሚሠራው ቅጦችን በመለየት ነው። ሥርዓቱ ይህን ለማድረግ መሰልጠን መቻል አለበት። የስርዓቱ አልጎሪዝም ከፍተኛ መጠን ያለው ውሂብ ግብዓት ይቀበላል, እና በአንድ ጊዜ ከዚያ ውሂብ ቅጦችን መለየት ይችላል. የዚህ ሂደት የመጨረሻ ግብ እነዚህ የኮምፒዩተር ሲስተሞች ምንም አይነት የሰው ጣልቃገብነት ወይም እርዳታ ሳያስፈልጋቸው ራሳቸውን ችለው እንዲማሩ ማስቻል ነው።
ከማሽን ትምህርት ጎን ለጎን መጥቀስ በጣም አስፈላጊ የሆነው ሌላው ነገር ጥልቅ ትምህርት ነው። በጥልቅ ትምህርት ሂደት ውስጥ በጣም አስፈላጊ ከሆኑት መሳሪያዎች አንዱ አርቲፊሻል ነርቭ ኔትወርኮች የሚባሉት ናቸው. ከሰው አንጎል አሠራር እና አሠራር ጋር ተመሳሳይነት ያላቸው የላቀ ስልተ ቀመሮች ናቸው። ነገር ግን፣ ከባዮሎጂካል አንጎል በተለየ መልኩ ፕላስቲክ እና በአናሎግ ላይ የተመሰረተ ቋሚ እና ተምሳሌታዊ ናቸው። ባጭሩ ይህ ጥልቅ ትምህርት በዋነኛነት በአርቴፊሻል ነርቭ አውታሮች ላይ የተመሰረተ እጅግ ልዩ የሆነ የማሽን መማሪያ ዘዴ ነው። የጥልቅ ትምህርት ግብ የሰውን የመማር ሂደቶች በቅርበት መድገም ነው። ጥልቅ የመማሪያ ቴክኖሎጂ በጣም ጠቃሚ ነው, እና በድምፅ ቁጥጥር በሚደረግባቸው የተለያዩ መሳሪያዎች ውስጥ ትልቅ ሚና ይጫወታል - ታብሌቶች, ቴሌቪዥኖች, ስማርትፎኖች, ፍሪጅ ወዘተ. ተጠቃሚው ወደፊት እንደሚገዛው. ጥልቅ የመማር ቴክኖሎጂም በሕክምናው ዘርፍ በሰፊው ጥቅም ላይ ይውላል። ለካንሰር ተመራማሪዎች በጣም አስፈላጊ ነው, ምክንያቱም የካንሰር ሕዋሳትን በራስ-ሰር ለመለየት ይረዳል.
አሁን ወደ ንግግር እውቅና እንመለሳለን. ይህ ቴክኖሎጂ ቀደም ሲል እንደገለጽነው የተለያዩ ቃላትን እና የንግግር ቋንቋን ሀረጎችን ለመለየት ያለመ ነው። ከዚያ በኋላ ማሽኑ ማንበብ ወደሚችለው ቅርጸት ይቀይራቸዋል. መሰረታዊ ፕሮግራሞች አነስተኛ ቁጥር ያላቸውን ቁልፍ ሀረጎችን ብቻ ይለያሉ፣ ነገር ግን አንዳንድ የላቀ የንግግር ማወቂያ ሶፍትዌር ሁሉንም አይነት የተፈጥሮ ንግግር መፍታት ይችላል። የንግግር ማወቂያ ቴክኖሎጂ በአብዛኛዎቹ ሁኔታዎች ምቹ ነው, ነገር ግን አንዳንድ ጊዜ የቀረጻው ጥራት በቂ ካልሆነ ወይም የድምፅ ማጉያውን በትክክል ለመረዳት የሚያስቸግሩ የጀርባ ድምፆች ሲኖሩ ችግሮች ያጋጥሙታል. ተናጋሪው በጣም ጠንካራ የሆነ ዘዬ ወይም ዘዬ ሲኖረው አሁንም አንዳንድ ችግሮች ሊያጋጥመው ይችላል። የንግግር ማወቂያ በየጊዜው እያደገ ነው፣ ግን አሁንም ፍፁም አይደለም። ሁሉም ነገር በቃላት ላይ አይደለም፣ ማሽኖች አሁንም የሰው ልጅ ሊያደርጋቸው የሚችላቸው ብዙ ነገሮችን ማከናወን አይችሉም፣ ለምሳሌ የሰውነት ቋንቋን ወይም የአንድን ሰው ድምጽ ቃና መፍታት አይችሉም። ነገር ግን፣ ተጨማሪ መረጃዎች በእነዚህ የላቀ ስልተ ቀመሮች ሲፈቱ፣ ከእነዚህ ተግዳሮቶች መካከል አንዳንዶቹ በችግር ውስጥ እየቀነሱ ይሄዳሉ። ወደፊት ምን እንደሚያመጣ ማን ያውቃል? የንግግር ማወቂያው የት እንደሚደርስ ለመተንበይ አስቸጋሪ ነው. ለምሳሌ ጎግል በጉግል ተርጓሚ ሞተሮች ውስጥ የንግግር ማወቂያ ሶፍትዌሮችን በመተግበር ረገድ ብዙ ስኬት እያስመዘገበ ሲሆን ማሽኑ ያለማቋረጥ እየተማረ እና እያደገ ነው። ምናልባት አንድ ቀን የሰውን ተርጓሚዎች ሙሉ በሙሉ ይተካሉ. ወይም ምናልባት ላይሆን ይችላል, የዕለት ተዕለት የንግግር ሁኔታዎች የሰውን ነፍስ ጥልቀት ለማንበብ ለማይችሉ ማሽኖች ለማንኛውም አይነት በጣም ውስብስብ ናቸው.
የንግግር ማወቂያን መቼ መጠቀም እንደሚቻል?
በአሁኑ ጊዜ ሁሉም ሰው ማለት ይቻላል ስማርትፎን ወይም ታብሌት አለው። በእነዚያ መሳሪያዎች ውስጥ የንግግር ማወቂያ የተለመደ ባህሪ ነው። የአንድን ሰው ንግግር ወደ ተግባር ለመቀየር ይጠቅማሉ። ለአያትህ መደወል ከፈለክ " ለአያቴ ጥራ " ማዘዙ በቂ ነው እና ስማርትፎንዎ በእውቂያ ዝርዝሮችዎ ውስጥ መተየብ ሳያስፈልግ ቁጥሩን እየደወለ ነው። ይህ የንግግር ማወቂያ ነው። የእሱ ሌላ ጥሩ ምሳሌ, አሌክሳ ወይም ሲሪ ነው. እንዲሁም ይህ ባህሪ በስርዓታቸው ውስጥ ጠንካራ ገመድ አላቸው። ጎግል ምንም ሳይተይቡ ማንኛውንም ነገር በድምጽ የመፈለግ አማራጭ ይሰጥዎታል።
ምናልባት ይህ ሁሉ እንዴት እንደሚሰራ አሁን ለማወቅ ጓጉተህ ይሆናል። ደህና፣ እንዲሠራ፣ እንደ ማይክሮፎን ያሉ ዳሳሾች በሶፍትዌሩ ውስጥ መገንባት አለባቸው፣ ስለዚህም የንግግር ቃላት የድምፅ ሞገዶች እንዲታወቁ፣ እንዲተነተኑ እና ወደ ዲጂታል ቅርጸት እንዲቀየሩ። ከዚያም አሃዛዊው መረጃ በአንዳንድ የቃላት እና የቃላቶች ማከማቻ ውስጥ ከተከማቹ ሌሎች መረጃዎች ጋር መወዳደር አለበት። ግጥሚያ በሚኖርበት ጊዜ ሶፍትዌሩ ትዕዛዙን አውቆ በዚህ መሠረት ሊሠራ ይችላል።
በዚህ ነጥብ ላይ መጠቀስ ያለበት አንድ ተጨማሪ ነገር WER (የቃላት ስህተት መጠን) ተብሎ የሚጠራው ነው. ይህ የስህተት ቁጥሩን ከጠቅላላው ቃላቶች ጋር የሚያካፍሉበት ቀመር ነው። ስለዚህ, በቀላል ቃላት ለማስቀመጥ, ከትክክለኛነት ጋር ብዙ ግንኙነት አለው. ግቡ በእርግጥ ዝቅተኛ WER እንዲኖር ነው, ምክንያቱም ይህ ማለት የተነገረው ቃል ቅጂ የበለጠ ትክክለኛ ነው ማለት ነው.
የንግግር ማወቂያ እንደ ቀድሞው ተፈላጊ ነው። የተቀዳ የድምጽ ፋይል እንበል የተነገረውን ቃል ወደ ጽሑፍ መለወጥ ካስፈለገዎት ወደ Gglot መዞር ይችላሉ። እኛ ትክክለኛ የጽሑፍ ግልባጮችን በተመጣጣኝ ዋጋ የምናቀርብ የጽሑፍ ግልባጭ አገልግሎት አቅራቢ ነን። ስለዚህ፣ ለተጠቃሚ ምቹ በሆነው ድረ-ገጻችን በኩል ለመገናኘት አያመንቱ።