የ Linux ጀርመን የድምጽ እውቅና

መግቢያ

ለጽንሾፖች ብዙ ጊዜዎችን በማጥናት ብዙ ጊዜ አውጥቻለሁ እናም በአብዛኛው ወደ አንድ የባቡር ጣቢያው ወይም ወደ ውጭ ሲወጣ እና ስለ አጠቃላይ ነገር ስለ ርዕሰ ጉዳይ ጉዳይ አስባለሁ.

አንድ ምሽት ከስራዬ ወደ 1.5 ኪሎሽ እየተጓዝኩ ሳለ የጻፍኩትን ነገር መዝግቤ ቢይዝ ጥሩ አይመስለኝም ከዚያም በኋላ እንደገና ማረም እና ቅርፀት ላስቀምጥ የጽሑፍ ፋይል ብጽፍ ጥሩ አይመስለኝም. .

በሊነክስ ውስጥ የቃል ፅሁፎችን በመጠቀም ድምጽ ማጉያ ሶፍትዌርን በቀጥታ በማቀናጀት, ፋይሎችን ወደ MP3 ወይም WAV ቅርፀት በመቅዳት እና በኮምፒዩተር መስመር በኩል በመለወጥ እና Chrome በመጠቀም እና የ Android መተግበሪያዎች.

ይህ ጽሑፍ ውጤቶቼን ከከባድ የጉልበት ሥራ ቀን በኋላ ያስረዳኛል.

የ Linux አማራጮች

በሊኑክስ ውስጥ የቃል ጽሑፍን እና የድምጽ ማወቂያ ሶፍትዌሮችን ለማግኘት መሞከር ልክ በተቻለ መጠን ቀላል አይደለም እና ያሉት አማራጮች ያን ያህል የተሳሳቱ አይደሉም.

ይህ የዊኪፔን ገጽ CMU Sphinx, Julius and Simon ጨምሮ ጨምሮ የእምቅ አማራጮች ዝርዝር አለው.

በአሁኑ ጊዜ በደቢያን ሙከራ ላይ የተመሰረተ SparkyLinux እየተጠቀመሁ ነው, እና በመርሐግብሩ ውስጥ የሚገኘው የድምጽ ለይቶ ማወቂያ ጥቅል Sphinx ብቻ ነው ልንነግርዎ እችላለሁ.

እኔ ለመሞከር የሄድኩት ቤልጂ ሊሊንክስ ፕሮግራሞች የፒክሴፕንክስ (PocketSphinx) ነበሩኝ. የ WAV ፋይሎችን ወደ ስክሪን እና Freespeech-VR መለወጥ እና ወደ ማይክሮፎን በቀጥታ ለመቅዳት የሚያስችል የዳይሬክተሩ መተግበሪያ ነው.

በተጨማሪም የድምፅ ማስታወሻን እና ዲክታተንን ጨምሮ ሁለት የ Chrome መተግበሪያዎችን ሞክሬያለሁኝ.

በመጨረሻም "የቃል እና ኢሜል" እና "የንግግር እና ንግግር" የ Android መተግበሪያዎችን ሞክሬያለሁ.

Freespeech-VR

Freespeech-VR በመደበኛ ማከማቻዎች ውስጥ አይገኝም. ፋይሎቹን ከዚህ አውጥቼ አውጥቻለሁ.

የዚፕ ፋይሎችን ካወረዱ በኋላ እና ወደ ውጭ ማውጣት ካስገባሁ በኋላ ተርሚናልን ከፍቼ ወደነበሩበት አቃፊ ሄዶ ነበር.

እኔ ስልጣን ለመክፈት የሚከተለውን ትዕዛዝ ተክቼ ነበር.

sudo python freespeech-vr

በጣም ጥሩ በሆነ ማይክራፎን እና በደንብ ግልጽ የደቡባዊ እንግሊዝኛ ዘይቤ ያላቸው ጥንድ የጆሮ ማዳመጫዎች አሉኝ.

የሚከተለው ጽሑፍ በ freespeech-vr መስኮት ላይ ታየ

የፍተሻ ዶሮዎች እንኳን ደህና መጣችሁ. ዛሬ መቆጣጠር የሚቻለው እንዴት እንደሆነ ማረጋገጥ ለትርጂት ጊዜ እንዴት እንደሚሞከር መፈተሽ አለ መፅሐፍትን መቼት መሞከር እንዳለብን መፈተሸን እፈልጋለሁ እያንዳንዳቸው አንድ ላይ ለመኖር ተስፋ ያላቸው እና አንድ ዶሮዎች እንደ ወርቅ ሥርዓት ኤ ኤ በሚቀጥለው ውስጥ የስልክ ጥሪው ስሞል ሲሰይ ይህ ፋይል በፍጥነት ስልክ ወደ ሃንድስ-ቦታ sphinx Going That phones phones not shared Shows and tools መሳሪያዎ ሲጨርሱ ንግግርዎን ሲጨርሱ Say used in file Last a ታሪኩን አንድ እና በ እንዴት ነው ስኬታማነቱ በጣም ውጤታማ በሚሆንበት ጊዜ ይህ ሊኑክስ ልክ እርስዎ እንዳይወሉት ነው

አሁን የሻይዎች ድረገጽ ክፍል አለመሆኑን እና አሁን በወርቃማ ዶሮዎች ላይ ምንም ነገር አልተናገርኩም ብዬ መናገር እፈልጋለሁ. የድምጽ እውቅና ሶፍትዌርን የመጠቀም ሂደትን ለመሞከር እየሞከርኩ ነበር.

ሶፍትዌሩን ለጥቂት ጊዜ ሞክረውና የተለያየ ፍጥነት እና ፍጥነትን ሞክሬ ነገር ግን ትክክለኛነት ደካማ ነበር.

PocketSphinx

PocketSphinx የ WAV ፋይልን ለመውሰድ እና የትእዛዝ መስመርን በመጠቀም እንደ ጽሑፍ ሊለውጥ ይችላል.

PocketSphinx በዲቢያን ማከማቻዎች በኩል ይገኛል, እና ለአብዛኞቹ ስርጭቶች ዝግጁ መሆን አለበት.

በ PocketSpinx ያገኘሁት ዋነኛው ችግር በድምጽ እውቅና, ቋንቋ ፋይሎች, መዝገበ ቃላት እና ስርዓቱን እንዴት ማሠልጠን እንደሚፈልጉ ነው.

PocketSphinx ከተጫነ በኋላ ወደ CMU Sphinx ድርጣቢያ በመሄድ በተቻለ መጠን ብዙ መረጃን ማንበብ አለብዎት. እንዲሁም የሚከተለውን የሞዴል ፋይል ማውረድ አለብዎት.

(የእንግሊዝኛ ቋንቋ ተናጋሪ ካልሆኑ ለእርስዎ ተገቢ የሆነውን የቋንቋ ሞዴል ይምረጡ.)

የ PocketSpinx እና Sphinx ሰነዶች በአጠቃላይ ለተጋጭ ሰው ለመረዳት አስቸጋሪ ናቸው, ግን የመዝገበ-ቃላት መዝገቦችን ለማዘጋጀት ከሚረዱት ቃላት ውስጥ የአቅጣጫዎች ዝርዝር እና የቋንቋ ሞዴሎች የቃላት አሰራሮች ዝርዝር አላቸው.

PocketSphinx ለመሞከር የእራሴን ድምጽ ቀረጻን, ከ "ዲያቢሎስ ተከራካሪ" እና "ሞርገን ፍሪማን" አጫጭር ፊደላትን ከአል ፓሲኖ እጠቀም ነበር. የዚህ ነጥብ ዋንኛ የተለያዩ ድምፆችን መሞከር ነበር እናም ለእኔ አንድ ታሪክ እንደ ሞርጋን ፍሪማን እና በግልጽ እንደማንኛውም ሰው እንደ አል ፓሲኖ የተሰራ መስመር የለም.

ለ PocketSphinx ለመሥራት የ WAV ፋይል ያስፈልገዋል እና በተወሰነ ቅርፀት መሆን አለበት. ፋይሉ በ MP3 ቅርጸት ከሆነ በ fwm ፎርምን ለመቀየር የ ffmpeg የሚለውን ትዕዛዝ ተጠቀም.

ffmpeg -i inputfilename.mp3 -acodec pcm_s16le-16000 outputfile.wav

PocketSphinx ን ለማሄድ የሚከተለው ትዕዛዝ ይጠቀሙ:

pocketsphinx_continuous -dict /usr/share/pocketsphinx/model/lm/en_US/cmu07a.dic -infile voice2.wav -lm cmusphinx-5.0-en-us.lm 2> voice2.log

pocketsphinx_continuous የ WAV ፋይል ይወስድና ወደ ጽሑፍ ይለውጣል.

ከላይ ባለው ትዕዛዝ ውስጥ pocketsphinx "/usr/share/pocketsphinx/model/lm/en_US/cmu07a.dic" የተባለ የመዝገበ ቃላት ፋይልን "cmusphinx-5.0-en-us.lm" የሚባል የመዝገበ-ቃላት ፋይል እንዲጠቀም ይነገራል. ወደ ጽሑፍ የሚቀየር ፋይል ድምጽ2.wav (በድምጽ እኔ የፈጠርኩት ቀረጻ) ይባላል. በመጨረሻ 2> ሁሉም የድምፅ / የድምጽ ውፅዓት ወደ የድምፅ ፋይል (voice2.log) ተብሎ የሚጠራ ፋይልን አያስቀምጥም. የሙከራው ውጤት በአትክልቱ መስኮት ውስጥ ይታያል.

ድምጼን በመጠቀም የሚጠቀሱት ውጤቶች እንደሚከተለው ናቸው-

በደህና ወደ ሚቀጥለው እንኳን ደህና መጡ, በዚህ ሳምንት ውስጥ የትኛው የማረጋገጫ ሶፍትዌር በአጭር ደቂቃ ውስጥ ነው

ውጤቶቹ እንደ freespeech-vr ያህል አስቀያሚ አይደሉም ነገር ግን አሁንም ድረስ ጥቅም ላይ የማይውሉ ናቸው. እኔ PocketSphinx ን ከ አል ፓሲኖ ጋር ለመጠቀም ሞክሬ ነገር ግን ምንም ውጤት አልተገኘልኝም.

በመጨረሻም "ብሩስ ሁሉን ቻይ" ከሚለው ፊልም የሞርጋን ፍሪሜንን ድምጽ በመጠቀም ሞክሬያለሁ.

000000000: እኛ እንጨምራለን
000000001: ሁሉም የቀን ቀን ነው በጣም የተደላደለን ይህ በጣም ያ እጅግ ሞቃት ነው አሁን በህይወት ያለሁት በሞቃት
000000002: በአሳሽ ውስጥ ከሚገባው የቤዝቦል ሰዓት ውስጥ ቁልፍ ያለው ማን ነው ወይም በህይወት ውስጥ ምን ማድረግ እንደሚገባዉን
000000003: ተመልሰዋል የሚባሉት
000000004: እነሱ አልፃፉት
000000005: እነሱ በቀጥታ ውሰደኝ
000000006: ደንቦች መሆን አለብዎት
000000007: ጠብቄያለሁ
000000008: ምሳሌው እዚህ ላይ የተማረ ሰው ገዳይ የገናን ፓርቲ ያዘጋጀ ነበር
000000009: ይሄው ለመጻፍ ከሚፈልጉት መንገዶች መካከል አንዱ ነው o. ብዙ ጥቂቶች አንድ ጊዜ ብቻ ይለብሳሉ ብዬ አሰብኩ
000000010: ልክ አንድ ችግር እንደ አንድ ችግር አይሰጥም. እኔ እስካሁን ድረስ የተገመተኝ እኔ በዚያ ዓለም ውስጥ እንደሆንኩ ያላሰብኩትን ሁሉ ባላሰብኩበት ጊዜ እኔ ባየሁት መሠረት እኔ እስካሁን የተገመትን
000000011: አባት ያለው
000000012: ምን እናድርግ
000000013: ያንን ይሰላል
000000014 ለብዙዎች የማይወድሙ ሁሉም ነገሮች
000000015: በውድቀት ውስጥ
000000016 ለእኔ ለኔ በጣም ጥሩ
000000017: ያገባኛል ብዬ ካሰብኩ በስተቀር, ያገባኛል ብዬ ካሰብኩ በስተቀር ያገባኛል ይባላል.

የእኔ ሙከራ እንደ ሳይንቲስቶች ተደርጎ ሊቆጠር አይችልም እና የ PocketSpinx አዘጋጆች ሶፋዩን በትክክል እንዳልጠቀም ሊገልጹ ይችላሉ. በተጨማሪም የተሻሉ የመዝገበ-ቃላት እና የቋንቋ ፋይሎች ለመፍጠር ጥቅም ላይ ሊውል የሚችል የስልጠና ስልት የሚባል ዘዴ አለ.

ይሁን እንጂ በጣም የሚያስደስት አስተያየት ለመደበኛ የዕለት ተዕለት አጠቃቀም በጣም አስቸጋሪ ስለሆነ ነው.

የድምፅ ማርክ II

የድምጽ ደረጃ II የ Google ድምጽ እውቅና ኤፒአይ የሚጠቀም የ Chrome መተግበሪያ ነው.

የ Chrome ወይም Chromium አሳሾችን የሚጠቀሙ ከሆኑ በድር መደብር በኩል የድምጽ ማስታወሻን II መጫን ይችላሉ.

በ VoiceNote II ምስሎች ያልተለመዱ ናቸው. በመስኮቱ ግርጌ ላይ ቋንቋውን ማቀናበር ስለሚያስፈልግዎ የአርትእ አዝራሩ ደግሞ ከታች ነው, ነገር ግን የቅብጥ አዝራሩ ከላይ በቀኝ በኩል ያለው ቦታ ላይ ነው.

እርስዎ ማድረግ ያለብዎት የመጀመሪያው ነገር ቋንቋን መምረጥ እና ይህ የዓለም አዶን ጠቅ በማድረግ ሊደረስበት ይችላል.

ቀረጻ ለመጀመር, የማይክሮፎን አዶን ጠቅ ያድርጉና ወደ ማይክሮፎንዎ ለመናገር ይጀምሩ. ጥሩ ውጤት ለማግኘት ሶፍትዌሩ የመቀጠል እድል እንዲኖረው ቀስ በቀስ መናገር ቻልኩ.

ውጤቶቹ ከዚህ በታች ሊታዩ የሚችሉ አይደሉም:

ሠላም እና ለመገናኘት እንኳን ደህና መጡ. About.com ከድምፅ ወደ ጽሁፍ ቅልጥፍና / ዲኖልል ሪፈርድ ሪደር ሪፖርቶች በ 2008 እንደ ለውጦች እና ዛሬ የተሻለውን መንገድ የተደገፈ የ 2014 ዴቢያን ወይም ሩፒ / በ edinburgh ውስጥ የፈረንሳይኛ ጀርመንኛ መረጥዎ ጊዜዎን በዩኒቨርሲቲ የባህር ማይክሮፎን ውስጥ ጊዜዎን ያሳልፋሉ የጽሁፍዎን እንደ የጽሑፍ ፋይል አድርጎ ለመጻፍ ሲጨርሱ ያ በጣም ጥሩ መደበኛ የደብዳቤ ከንግግር ከደቡብ ደቡባዊ ክፍል ለዚያ በጣም ጥሩ ነው, ነገር ግን ወደ ጽሑፍ via ወደ ተንቀሳቃሽ ወንዞቼ ይሄዳል ከትክክለኛው ሰነድ ጋር እና እርስዎ ለማዳመጥ ለሚፈልጉዎ ስህተቶች ይታያሉ

Dictanote

Dictanote ሌላ የ Chrome መተግበሪያ ነው, እሱም ለጽሑፍ አላማዎች ጥቅም ላይ ሊውል የሚችል እና የበለጠ ግንዛቤ ያለው ሆኖ ነገር ግን ውጤቱ ከሁለተኛ የድምጽ ቁጥር II የተሻለ አልነበረም.

እኔ አዲስ ሰነዶችን ከመፍጠር የሚያግድዎትን የ Dictanote የሙከራ ስሪት እጠቀማለሁ ነገር ግን በአርትዖት ውስጥ ቀድሞውኑ ጽሁፍ ላይ እንዲያወሩ ያስችልዎታል. የድምጽ ለይቶ ማወቂያውን ለመሞከር ችያለሁ, ነገር ግን ውጤቶቹ ከፍትኛ ቁጥር II አልተሻሉም, ስለዚህ ለፕሮቪዥን ስሪት አልገባሁም.

የቃል ጽሑፍ እና ደብዳቤ

"Dictation And Mail" የቤተኛውን የ Google ድምጽ ዕውቅና ማረጋገጫ ኤፒአይ የሚጠቀም የ Android መተግበሪያ ነው.

የ "ቃል እና ደብዳቤ" ውጤቱ እስከዚህ ነጥብ የተራዘመ መርሃግብር ከተሻለ ከማንኛውም ፕሮግራም በጣም የተሻለ ነበር.

ወደ ሊነክስ እንኳን በደህና መጡ, ዛሬ እኛ ድምጽን ወደ ጽሑፍ ስለመቀየር እንነጋገራለን

በ "Dictation and Mail" ውስጥ ያለው ሽግግር በቀስታ እና በቃላት መናገር እንዲሁም በድምፅ ዘዬ መጠቀም ይችላሉ.

ንግግሩን ከጨረሱ በኋላ ውጤቶቹን ለእራስዎ መላክ ትችላላችሁ.

የንግግር እና የንግግር ስነስርዓት

የሞከርኩት ሌላው የ Android ትግበራ «Talk Talk Talk እና የቃል ፅሁፍ» ነበር.

ለእዚህ መተግበሪያ በይነገጽ ምርጡን በጣም ጥሩ እና የድምጽ እውቅና በትክክል በጥሩ ሁኔታ ሰርቷል. የቃል ምልክቱን ከተመዘገበ በኋላ ውጤቱን በተለያዩ መንገዶች በኢሜይል በኩል ማካተት ችዬ ነበር.

ዛሬ ወደ linux about.com እንኳን ደህና መጡ ማለት ንግግርን ወደ ጽሑፍ ስለ መቀየር ነው

ከላይ ያለው ጽሑፍ ሊያገኙት እንደሚችሉት ግልጽ ነው. ቀስ ብሎ መናገሩ ቁልፍ ነው.

ማጠቃለያ

ቤተኛ ሊነክስ ከድምጽ ለይቶ ማወቅን እና በተለይም የቃል-ስነ-ጽሑፍን በተመለከተ የሚሄዱበት መንገድ አለው. የ Google ድምጽ ኤፒአይ የሚጠቀሙ አንዳንድ መተግበሪያዎች አሉ ነገር ግን እነሱ በውሂብ ማከማቻዎች ውስጥ አልተዘረዘሩም.

የ ChromeOS መተግበሪያዎች ትንሽ የተሻለ ይሁኑ ግን የ Android ስልኬን በመጠቀም የላቁ ውጤቶችን ለማግኘት ደርሰዋል. ምናልባት ስል የተሻለ ማይክሮፎን አለው, ስለዚህ የድምጽ ማረጋገጫ ሶፍትዌሩ የተሻለ የመለወጥ እድልን የሚያመለክት ሊሆን ይችላል.

የድምፅ ለይቶ ማወቂያው በእውነት ጥቅም ላይ እንዲውል, አነስተኛ አተገንስ ባለው ማዋቀር የበለጠ ግንዛቤ ያለው መሆን አለበት. ቋንቋን ሞዴሎች እና መዝገበ ቃላት በመጠቀም ማስተዋወቅ እንዲቻል ማድረግ የለብዎትም.

ይሁን እንጂ ሁሉም የድምፅ አዋቂነት አሠራር በጣም ፈታኝ ነው ምክንያቱም ሁሉም ሰው የተለየ ድምጽ ያለው ሲሆን በአገሪቱ ውስጥ ከአንድ መቶ ሃምሳ ቋንቋዎች ጋር በመላው ዓለም በሚታወቁ በመቶዎች በሚቆጠሩ ቋንቋዎች የተጨነቁ ናቸው.

ስለዚህም የእኔ ትንተና የድምጽ ማወቂያ ሶፍትዌሮች አሁንም በሂደት ላይ ናቸው.