Ano nga ba ang Ground-Truth Transcript?
Ipinaliwanag ng Ground-Truth Transcript :
Maikling panimula sa terminong "Ground Truth"
Nakatagpo mo na ba ang katagang "Katotohanan sa lupa"? Maaari nating hulaan kung ano ang maaaring ibig sabihin nito, isang uri ng ganap, pangunahing, hindi nagbabagong katotohanan, matatag na batayan para sa iba pang mga katotohanan? Ngunit, maaari bang maging tunay na layunin ang anumang katotohanan, dahil ang lahat ay palaging sinasala sa pamamagitan ng mga pansariling interpretasyon? Paano ang tungkol sa mahigpit na mga katotohanan at lohika, agham? Maaari ba tayong magbigay ng isang layunin na pagtatanghal ng katotohanan, sa paraang hindi nagdaragdag o kumukuha ng anuman? Bakit itinatanong ng mga tao ang mga tanong na ito na hindi masasagot sa isang tiyak na paraan, dahil ang bawat sagot ay aasa sa isang kumplikadong hanay ng mga pilosopikal na pagpapalagay, na maaari ding tanungin? Siguro maraming mga katotohanan na sumasaklaw sa isang tiyak na aspeto ng kung ano ang totoo, at maaari silang magamit nang magkakasama, komplementaryo? Marahil ay may iba't ibang sistema ng kaalaman, na nagbibigay-daan sa iba't ibang katotohanan? Kung may iba pang mga nabubuhay na anyo sa lahat ng napakalawak na espasyo, ang kanilang Katotohanan ba ay iba sa atin? Malayo na kami, alam namin, ngunit bigyan kami ng pagkakataong ipaliwanag kung bakit, at sa pagtatapos ng artikulo ay marami kang matututunan tungkol sa Ground Truth, at kung paano ito nauugnay sa The Truth sa pilosopiya, kung paano ito ginagamit sa siyentipikong pananaliksik, at sa wakas, ito ay kawili-wiling aplikasyon sa mga serbisyo ng transkripsyon.
Ang lahat ng mga nakalilitong panimulang tanong na ito ay may kaugnayan para sa pangkalahatang talakayan ng sangay ng pilosopiya na tinatawag na epistemology, ngunit medyo nasa labas ng saklaw ng kasalukuyang artikulong ito, dahil lilimitahan natin ang saklaw ng mga posibleng implikasyon ng terminong ito sa isa na pinakamalawak na ginagamit. sa agham at teknolohiya, at napaka-kaugnay din sa larangan ng transkripsyon, dahil pangunahin itong isang blog tungkol sa mga serbisyo ng transkripsyon at kung paano nito mapapabuti ang iyong buhay sa napakaraming paraan.
Ngunit gusto naming panatilihin ang aming mga tapat na mambabasa sa gilid, sa pamamagitan ng pagsorpresa sa kanila paminsan-minsan ng nerbiyoso, kahit na nakakalito ng mga pilosopikal na talata. Marahil ang ilan sa inyo ay nag-aaral pa nga ng pilosopiya sa isang undergraduate na antas, at ngayon ay gumagawa ng mga abstract na koneksyon sa pagitan ng wika, pilosopiya, agham at katotohanan mismo, at sinusubukang maunawaan ang lahat ng ito. Huwag mag-alala, hindi kailangang magmadali, ang bawat sagot ay pansamantala, at magbabago sa paglipas ng panahon. Mag-relax, bumalik sa iyong upuan, kama o sofa, at hayaan mong sabihin namin sa iyo ang tungkol sa Ground Truth sa isang mas madaling maunawaan, praktikal na konteksto ng agham at teknolohiya.
Ground Truth at ang siyentipikong pamamaraan
Magbibigay kami ngayon ng "tunay" na paliwanag ng nakakaintriga na terminong "Ground truth" mula sa pananaw ng agham at teknolohiya, at sa huli, ilalarawan namin kung paano mailalapat ang terminong ito sa larangan ng transkripsyon.
Sa madaling salita, ang Ground Truth ay isang termino na malawakang ginagamit sa maraming larangan ng agham at pilosopiya, at tinutukoy nito ang ganoong uri ng impormasyon na nagreresulta mula sa direktang pagmamasid. Ang isa pang termino para dito ay "empirikal na ebidensya", at ito ay kabaligtaran sa ganoong uri ng impormasyon na resulta ng hinuha, na kinabibilangan ng lahat ng uri ng pangangatwiran na ginawa ng isang priori, pagmumuni-muni, intuwisyon, paghahayag at iba pa. Ang empirismo ay may mahalagang papel sa pilosopiya ng agham, binibigyang-diin nito ang kahalagahan ng ebidensya, lalo na kapag ito ay nagsasangkot ng mga eksperimento. Ito ang ubod ng siyentipikong pamamaraan, batay sa prinsipyo na ang bawat uri ng hypothesis at teorya, upang maituring na wasto, ay dapat na masuri at sa gayon ay mapatunayan na totoo sa pamamagitan ng malapit, layunin na pagmamasid sa bahagi ng natural na mundo na sinusubukan nitong ipaliwanag, sa halip na gumuhit lamang ng mga konklusyon at interpretasyon nang nag-iisa o bahagyang sa pamamagitan ng pangangatwiran at teorya, hindi sinusuportahan ng ebidensya. Ang mga natural na siyentipiko ay madalas na ginagabayan ng mga prinsipyo ng empiricism, at may posibilidad na sumang-ayon na ang kaalaman ay nagmumula sa karanasan, at na sa esensya nito, anumang uri ng kaalaman ay probabilistic, pansamantala, ito ay may posibilidad na magbago sa paglipas ng panahon sa pamamagitan ng patuloy na rebisyon at kung minsan kahit na. mga palsipikasyon. Ang empirical na pananaliksik ay ang kakanyahan ng siyentipikong pamamaraan, kasama ang maingat na kinokontrol na mga eksperimento at tumpak na mga tool at instrumento para sa pagsukat. Dahil ang pang-agham na pananaw ay hindi nakikitungo sa anumang nakapirming, walang hanggang katotohanan, ngunit sa pamamagitan ng mga bagay na masusuri nang may higit na katumpakan at kutis, ginabayan nito ang pagsulong ng teknolohiya ng sibilisasyon ng tao, at patuloy na nagpipilit na magbigay ng higit pang datos at paghubog. mas tumpak na tanong tungkol sa mundo sa paligid natin. Gayunpaman, ang siyentipikong pamamaraan ay may mga lohikal na limitasyon, hindi nito masusukat at tiyak na masusubok ang pansariling karanasan na natatangi sa bawat tao, at sa gayon ay hindi makapagbibigay ng mga makabuluhang sagot tungkol sa kung ano ang ibig sabihin ng pagiging isang tao, at kung paano mamuhay. magandang buhay. Ang mga katanungang tulad nito ay hinahawakan sa pamamagitan ng ibang paraan, masusing sinusuri ng pilosopiya, inilarawan at sinasagot sa panitikan at sining, na, sa pamamagitan ng artistikong merito nito ay may kakayahang makipag-usap at sumasalamin sa isip, kaluluwa at katawan ng tao.
Anumang malalim at mahusay na pagkakagawa ng likhang sining ay may kakayahang magpahayag ng malalim at makabuluhang mga Katotohanan tungkol sa Buhay at Kamatayan at kalagayan ng tao sa pangkalahatan, ngunit ang sagot na iyon ay hindi kailanman magiging isahan, dahil ang gayong katotohanan ay resulta ng synthesis ng subjective na katotohanan na gumabay. ang may-akda at ang subjective na katotohanan ng mambabasa, o manonood o tagapakinig. Gayunpaman, ang huling resulta ng lahat ng mahusay na sining ay upang palawakin at pagyamanin ang personal na ideya ng katotohanan ng mamimili ng sining na iyon, tulad ng isang magandang pag-uusap kung saan ang magkabilang panig ay walang layunin na kumbinsihin ang iba, ngunit pareho silang nakaramdam ng mabuti pagkatapos, dahil natutunan nila. isang bagay na bago, at pinalawak ang kanilang pang-unawa sa kanilang sariling pananaw, at iba't ibang pananaw na posible rin. Mayroong walang katapusang bilang ng mga posibleng pananaw sa napakaraming bagay, at kapag sinusubukang tingnan ang mundo mula sa mahusay na pagkakapahayag ng pananaw ng ibang tao, nakikita natin ang mga bagong posibilidad at paraan ng umiiral, at nagiging hindi gaanong nanganganib sa mga anino ng makitid na pag-iisip at kakulangan ng imahinasyon.
Mga istatistika at machine learning
Bumalik sa mga praktikal na implikasyon ng "Ground truth", maaaring sabihin na sa isang paraan ay isang konseptong termino na palaging nauugnay sa umiiral nang kaalaman sa katotohanan. Sa mas simpleng mga termino, ito ay nauugnay sa mga kilalang sagot tungkol sa isang tiyak na tanong, maaari itong tukuyin bilang perpektong inaasahang resulta, ang pinakamahusay na posibleng sagot. Ito ay maaaring, halimbawa, gamitin sa iba't ibang modelo ng mga istatistika upang patunayan o pabulaanan ang anumang uri ng mga hypotheses ng pananaliksik.
Sa anumang uri ng mga eksperimento tulad nito, ang terminong "ground truthing" ay ginagamit upang ipahiwatig ang proseso kung saan ang wastong data, layunin at mapapatunayan, ay natipon para sa layunin ng pag-verify ng iba pang empirical na data. Maaari naming, halimbawa, subukang subukan ang pagganap ng isang partikular na stereo vision system, isang camera device na ginagamit upang tantyahin ang mga 3D na posisyon ng mga bagay. Sa kasong ito, ang "ground truth" ay ang pangunahing, layunin na reference point, at ibinibigay sa pamamagitan ng paggamit ng data mula sa laser rangefinder, isang device na mas kumplikado at tumpak kaysa sa camera system. Inihahambing namin ang pagganap ng system ng camera sa pinakamahusay na pagganap na ibinigay ng laser rangefinder, at mula sa empirical na paghahambing na iyon ay nakakuha ng empirical na data, na pagkatapos ay magagamit para sa karagdagang pag-aaral, dahil ito ay na-verify at nasubok. Ang ground truth ay maaari ding isipin bilang isang napaka-tumpak, naka-calibrate na piraso ng metal, na alam ang timbang, na inilalagay mo sa isang dulo ng sukat ng balanse ng old-school na iyon, at ang mga resulta na makukuha mo mula sa iba pang mga bagay ay inilalagay sa kabilang dulo ng sukat, at sa pamamagitan ng paghahambing ng dalawang numerong ito ay makukuha mo ang tumpak na sukat. Ang sukat ng balanse ay kumakatawan sa pamamaraan sa likod ng iyong proseso, at maaari rin itong magbigay ng mga maling sagot, kung ang pamamaraan ay hindi maingat na sinusubaybayan at lohikal na inilalapat.
Mga serbisyo ng ground truth at transkripsyon
Ang terminong ground truth transcript sa konteksto ng mga serbisyo sa wika, ay nabuo bilang resulta ng pagsasanib ng artificial intelligence, machine learning at advanced, automated transcription program. Ito ay kumakatawan sa isang perpektong transkripsyon, ibig sabihin, ang proseso ng paghahatid ng isang pasalitang pananalita sa format ng teksto, nang walang anumang mga pagkakamali. Masasabi nating inilalarawan nito ang ganap, o hindi bababa sa pinakamahusay na posibleng katumpakan. Ginagamit ito kapag gusto mong makita kung gaano katumpak ang isang automated speech recognition software, o mas partikular ang output ng software na iyon.
Ang ground truth transcript ay ginagawa ng isang propesyonal na tao dahil ito ay dapat na ganap na tumpak. Sa kasamaang palad, ang artificial intelligence ay may mahabang paraan upang makamit ito, kahit na ito ay may magandang pagkakataon na makarating doon sa isang punto. Mahalagang bigyang-diin na kung gusto mong subukan ang isang algorithm sa pag-aaral ng makina, kailangan mong gawin ang iyong mga pagsusuri laban sa katotohanan, kailangan mo ang empirikal na ebidensya, tulad ng inilarawan namin sa mga nakaraang talata. Kaya, kailangan mong suriin at i-verify ang kalidad ng pagganap ng isang algorithm laban sa ground truth transcript na ginagawa ng isang napakahusay na transcriber ng tao. Kung mas malapit ang awtomatikong transkripsyon sa perpektong resulta, mas tumpak ito.
Paano ka makakakuha ng maaasahang ground truth transcript?
Una kailangan mong kunin ang iyong ground truth data na gagamitin mo para sa iyong checkup. Kailangan mong pumili ng ilang sample ng audio file kung saan dapat kang lumikha ng isang malaking file. Ang susunod na hakbang ay ang tumpak na pagkaka-transcribe sa kanila. Lubos naming inirerekumenda na gumamit ka ng propesyonal na transcriber ng tao, na may maraming karanasan at magagandang review para gawin ang transkripsyon na ito. Magagawa mo rin ito nang mag-isa, ngunit kailangan mong ihanda ang iyong sarili sa pagkawala ng ilan sa iyong mahalagang oras. Gayundin, ito ay may posibilidad na maging isang nerve-racking na gawain kung hindi ka sinanay na gawin ito. Ang iba pang opsyon na mayroon ka ay ipadala ang mga audio file sa isang transcription service provider tulad ng Gglot, na makakatulong sa iyo dito. Gagawin namin ang trabaho nang mabilis at para sa isang patas na presyo.
Nakikipagtulungan kami sa isang malaking bilang ng mga propesyonal na freelance na transcriber na maaaring maghatid ng mga transcript na may kamangha-manghang 99% na katumpakan. Sa ganitong paraan maaari kang umasa sa katotohanan na mayroon kang tumpak na transkripsyon ng ground truth. Pinahusay ng aming mga eksperto sa transkripsyon ang kanilang katumpakan sa pamamagitan ng mga dekada ng karanasan, at maaaring i-transcribe kahit ang pinakamasalimuot na sitwasyon sa pagsasalita, na ginagabayan ng kanilang mga kasanayan, kaalaman, at masigasig na pakikinig para sa detalye. Maaari kang magtiwala sa amin na ihahatid ka sa walang kamali-mali hangga't maaari na transkripsyon, na magagamit mo nang walang anumang pag-aalala upang subukan ang kalidad ng anumang iba pang mga transkripsyon, kahit na ang mga ito ay ginawa ng mga makina o ibang tao.
Mayroon ding isa pang mahalagang bagay na kailangan nating banggitin dito. Gumagawa din ang aming mga freelancer ng ground truth transcription para sa aming speech recognition team dito sa Gglot.
Mahalagang malaman na nakikipagtulungan din kami sa speech to text software. Ang software ng artificial intelligence na ito ay gumagawa ng draft ng audio file. Ginagamit ng aming mga taong transcriber ang draft na ito kapag nagsimula sila sa kanilang pag-transcribe. Kaya, maaari nating sabihin na ang ating mga freelancer at ang ating AI software ay may symbiotic na relasyon kung saan sila ay tumutulong sa isa't isa. Ito ay isa sa mga sikreto ng tagumpay ng kumpanya. Palagi kaming nagsu-surf sa walang katapusang alon ng teknolohikal na pagpapabuti, ginagabayan ng aming pananaw sa pagbibigay ng walang kamali-mali na mga transcript para sa abot-kayang presyo sa mga taong nangangailangan ng mga ito, at sa gayon ay nagpapabuti ng komunikasyon at pag-unawa para sa lahat ng sangkatauhan.