Google vient de débuter une nouvelle expérience autour de la voix: ses ordinateurs fabriquent un fichier sonore correspondant à la lecture de certains article de son encyclopédie Knol, le clone de Wikipedia.
J'ai écouté le fichier de cette page: la voix n'est pas trop métallique. La technologie "Text-to-Speech" ne cesse de faire des progrès depuis 10 ans car elle fait partie des technologies qui profitent au mieux de la puissance brute toujours plus massive apportée par la loi de Moore.
Avec cette initiative, Google travaille très directement de la sens de sa mission à échéance de 300 ans "organiser à l'échelle mondiale les informations dans le but de les rendre accessibles et utiles à tous".
Par cette expérience, il sert clairement le côté "rendre accessible" (par d'autres canaux) une information existante. Il ne peut guère l'appliquer qu'à Knol pour l'instant car Google a pris la précaution de posséder des droits d'utilisation larges pour les contenus entrés par sa communauté. Pour des contenus tiers sur Internet se poseraient tout de suite des questions de propriété intellectuelle: la version sonore d'un texte en est un travail dérivé. Elle ne pourrait être diffusée sur Internet sans l'assentiment de l'auteur original....
Après la gymnastique inverse ("Speech-to-Text") appliquée aux vidéos de Youtube, il semble que la voix ait une forte priorité actuellement chez Google.
Or, le modèle de Google est 100% publicitaire (en fait 98.9%), on pourrait alors déduire qu'apparaîtra bientôt une nouvelle forme de publicité vocale via Google pour sponsoriser ces contenus. Avec l'acquisition de la plate-forme Dmarc, le géant de Mountain View est déjà équipé depuis longtemps pour la vendre!
Enfin, si on combine, de plus, speech-to-text avec traduction (où Google est très fort depuis toujours) puis avec text-to-speech, on peut alors passer des vidéos ou des podcasts d'une langue à l'autre à un coût nul.
D'où une amélioration quantique de l'accès au patrimoine culturel multimédia mondial. Je suis sûr que cela va venir!
PS: bien sûr les esprits chagrins noteront que toutes ces technologies en 1 seule main, c'est beaucoup (trop ?) de puissance. Ils n'auront pas 100% tort....
[Via P. Lenssen]
Source: blog Media & Tech (par didier durand)
Aucun commentaire:
Enregistrer un commentaire