Ses konuşma tanımlayıcı yazılımlar
Bu madde, Vikipedi biçem el kitabına uygun değildir. (Ocak 2010) |
Sesli konuşmayı yazıya çeviren bilgisayar yazılımları veya daha yaygın ve bilinen İngilizce adıyla "Speech recognition"
kelime açılımı kök anlamıyla ses kayıt tespiti ; Dikte - [Türkçe Konuşma Tanıma]
genelde bilinen Konuşma Sentezleyici veya Speech Synthesizer, programlarının aksine mikrofon benzeri bir şekilde daha önceden alınan bir konuşma veya diyalogun bilgisayar üzerinde yazılı bir hale getirilmesi için kullanılan programlardır.
kullanım alanları
[değiştir | kaynağı değiştir]özellikle gazetecilik açısında video ve ses formatında alınan görüşme ve mülakatların bilgisayar ortamında arşivlenmesi ve daha sonraki süreçlerde kişilerin hangi sözü ne zaman söylediğini ortaya çıkması açısında kullanıldığı gibi ulusal güvenlik açısında yasal zaman aşımı süresince kaydedilen telefon görüşmelerinin şüpheli konuşma veya anahtar kelimeli arama için dinleme işinin yasal anlamda tarafsız olarak bilgisayar tarafından tanımlanmasıdır.
Free software
[değiştir | kaynağı değiştir]- CMU Sphinx — open source under a BSD license
- Julius — BSD-style license
Free speech corpus and acoustic model repositories
[değiştir | kaynağı değiştir]Proprietary software
[değiştir | kaynağı değiştir]- AT&T WATSON 10 Şubat 2009 tarihinde Wayback Machine sitesinde arşivlendi.
- HTK — copyrighted by Microsoft, but altering the software for the Licensee's internal use is allowed.
- CSLU Toolkit
- Dragon NaturallySpeaking from Nuance Communications is the continuous-speech successor to the older DragonDictate product, and appears to be the focus of all their current development effort (in the dictation area). Since version 10.1 it runs on 64-bit Windows, too.
- IBM ViaVoice - Control and development as it pertains to embedded processors remain in the hands of IBM. Linux, Mac OS, and Windows products were licensed to Nuance Communications (formerly ScanSoft) which has since discontinued the product. The Nuance website provides a list of which legacy systems can run the final versions.
- MacSpeech Dictate - Mac OS X speech recognition using the Dragon NaturallySpeaking engine. This replaces MacSpeech's former iListen product which is based on Philips Speech Technology.
- Microsoft Windows Speech Recognition - Windows Vista and Windows 7 includes version 8.0 of the Microsoft speech recognition engine along with a completely new end user speech experience, known as Windows Speech Recognition.
- Microsoft Speech API - Speech recognition functionality included as part of Microsoft Office and on Tablet PCs running Microsoft Windows XP Tablet PC Edition. It may also be downloaded as part of the Speech SDK 5.1 for Windows applications, but since that is aimed at developers building speech applications, the pure SDK form lacks any user interface, and thus is unsuitable for end users.
- Philips SpeechMagic - Market leader within the medical industry according to Frost & Sullivan, Philips SpeechMagic is a recognition engine that may be run either as a stand-alone product or integrated into other applications.[1][2]
- Proteus Conversational Interface
- Simmortel Voice
- Quack.com (acquired by AOL)
- SpeechWorks
- Tellme Networks (acquired by Microsoft)
Kaynakça
[değiştir | kaynağı değiştir]- ^ http://www.forbes.com/businesswire/feeds/businesswire/2007/12/10/businesswire20071209005015r1.html[ölü/kırık bağlantı]
- ^ "Philips SpeechMagic named European Technology Leader by Frost & Sullivan". 15 Nisan 2008 tarihinde kaynağından arşivlendi. Erişim tarihi: 27 Kasım 2009.