Websites

Voice-to-text-overeenkomst kan nieuwe mobiele services aansporen

Converting Speech to Text in 10 Minutes with Python and Watson

Converting Speech to Text in 10 Minutes with Python and Watson
Anonim

Twee leveranciers van mobiele spraaktechnologie hebben samengewerkt tot services van energiedragers die voicemailberichten en telefonische vergaderingen naar tekst vertalen.

Ditech Networks, dat apparatuur levert die achtergrondgeluiden uit cel verwijdert -telefoontjes, ondertekende een exclusieve deal met SimulScribe om de voice-to-text technologie van dat bedrijf te verkopen en te integreren in nieuwe mobiele web-gebaseerde services.

Voice-to-text-diensten bieden duidelijke voordelen voor gebruikers die een geschreven bericht wanneer ze geen toegang hebben tot een toetsenbord en voor ontvangers die niet de tijd of de neiging hebben om naar hun berichten te luisteren. Maar het nauwkeurig transcriberen van gesproken woorden was een serieuze computeruitdaging. Ditech zei te geloven dat SimulScribe de best beschikbare vertaaltechnologie heeft, maar zelfs daarmee zullen de bedrijven naast een volledige automatisering een door een operator ondersteund systeem aanbieden.

Als verkoper van spraakproducten heeft Ditech relaties met mobiele operators inclusief Verizon Wireless en AT & T. Het wil nu carriers de tools verkopen die ze nodig hebben om hun abonnees een voicemailtranscriptieservice aan te bieden die minder kost dan het gebruik van callcenteroperators. Als een add-on-service kost het opereren van operators om naar voicemails te luisteren en ze uit te typen meestal tussen de $ 5 en $ 25 per maand, afhankelijk van het aantal berichten, volgens Karl Brown, vice-president marketing bij Ditech. Een volledig geautomatiseerde service zou waarschijnlijk ongeveer $ 5 per maand kosten en in prijs dalen, en uiteindelijk het punt bereiken waarop vervoerders het gratis kunnen bundelen, zei hij. Ditech zal de technologie ook beschikbaar maken voor ondernemingen om intern hun eigen voicemails te transcriberen.

Ditech zal de technologie van SimulScribe integreren met zijn eigen mStage-productplatform voor stemkwaliteit, dat de nauwkeurigheid van stem-naar-tekst in typische gebruiksomgevingen zal verbeteren, zei het bedrijf. Het bedrijf is ook van plan om de technologie van SimulScribe te integreren in een reeks tools, Toktok genaamd, die het vandaag in een bètatest aanbiedt. Toktok, een reeks mobiele webgebaseerde applicaties, bevat functies zoals spraakopdrachten, "gefluisterde" audiomeldingen van agenda-items en berichten voor sociale netwerken en memodicteren via de telefoon. Waarschijnlijk zal het in de komende twee maanden uit bèta tevoorschijn komen, aldus Brown.

Ditech zal onmiddellijk drie SimulScribe-services verkopen. SimulAuto is volledig geautomatiseerd en ontworpen om de soorten woorden te verwerken die worden gebruikt in standaard voicemailberichten en biedt het hoogste niveau van privacy omdat geen operator naar het bericht luistert, zei Brown. SimulHybrid kan delen van een bericht verzenden dat de software voor een menselijke operator niet zeker is om een ​​grotere nauwkeurigheid te garanderen. ScribeAll is ontworpen voor realtime conversie van spraak naar tekst van langere berichten of conference calls, met of zonder operator. De technologie van SimulScribe ondersteunt meerdere dialecten van zowel Engels als Spaans en is volgens Ditech wereldwijd beschikbaar. "Mensen hebben altijd geprobeerd om stem-naar-tekst te doen", althans de afgelopen 20 jaar, zei mobiele analist Jack Gold, van J. Gold Associates. Accenten zijn een probleem, evenals achtergrondgeluid. "Het werkt goed als je het commando en de controle gaat uitvoeren, het is heel moeilijk om te doen als je een volledig dictaat probeert te doen", zei Gold.

Met voldoende rekenkracht is dit type applicatie mogelijk, goud zei. Maar zelfs met een nauwkeurigheid van 99 procent kan één woord op de 100 fout zijn, wat het nut zou verminderen, zei hij. "Je moet het in de buurt krijgen van wat jij en ik in een gesprek zouden kunnen doen, verstandig", zei Gold.

Voor de exclusieve rechten om de voice-to-text technologie te verkopen, zal Ditech betaal SimulScribe $ 3,5 miljoen bij ondertekening en nog eens $ 3,5 miljoen aan het einde van het tweede jaar van de relatie. SimulScribe kan een extra $ 10 miljoen verdienen over drie jaar, aldus de bedrijven.