小说园

小说园>数字化生存1995 > 第13部分(第2页)

第13部分(第2页)

身在异地时,我们会用尽一切办法,来传达我们的意图,并且解读所有相关信号,力求索解出哪怕一丁点意思。电脑正是身处这样的异地——人类的土地上。让电脑开口

要电脑说话,有两种方式:重放先前录下的声音,或合成字母、音节或(最可能的是)音素的声音。两种方式各有利弊。让电脑说话和音乐的制作一样,你可以把声音存储下来(就像CD一样),然后重播,也可以采用合成的方式,根据曲调,重制音乐(就像音乐家一样)。

重述先前存储的说话内容,也就回到了听起来最“自然”的口、耳沟通方式,尤其是当我们存储的是一个完整的讯息时,就更显得如此。由于这个原因,大多数的电话留言都是以这种方式录制的。当你试图把录好的片段声音或个别单字拼凑起来的时候,结果就比较不如人意了,因为整体的韵律不见了。

过去,人们不大愿意用预录的谈话来作人机界面,因为这样会消耗电脑大多的存储容量。今天,它已经不太成问题了。

真正的问题也正是最明显的问题。你必须提前把话录下来,才能运用预录的谈话。假如你期望电脑说话的时候,不要把名字弄错,那么你就得先把那些名字存储起来。存储好的声音不能适用于随机的讲话。由于这个原因,人们使用了第二种方式——合成。

语音合成器会根据一些规则,把一串文字的内容逐字念出来(就跟你念这句话时没什么两样)。每一种语言都有所不同,因而合成的难易度也不尽相同。

英语是最难合成的语言之一,因为我们以一种奇怪而且似乎不合逻辑的方式来书写英文。其他一些语言,例如土耳其语,就容易多了。事实上,要合成土耳其语非常容易,因为基马尔在1929年把土耳其语从使用阿拉伯字母改为使用拉丁字母,这样转换的结果,使声音和字母之间形成了一一对应,每个字母都发音:没有不发音的字母或令人困惑的复合元音;因此,在单字的层次上,土耳其语简直令电脑语音合成器的美梦成真。

即使机器能够发出每一个和任何一个单字的音,还有别的问题。把合成的字音集合起来,在词组或句子的层次上,加上整体的节奏和语气,是非常困难的事情。然而这样做非常重要,不仅能让电脑说的话好听,而且还能根据说话的内容和意图表现出不同的色彩、表情和语调。否则,电脑发出来的声音就好像醉酒的瑞典人在喃喃自语一样单调得让人倒胃口。

我们现在开始看到(听到)有些系统正把语音合成和声音存储两种方式结合在一起,随着数字化越来越普遍,最终的解决方案将是两者合一。小型化的趋势

在下一个千年里,我们会发现我们和机器说的话,与我们和人类说的话一样多,或甚至比跟人类说的话还要多。和没有生命的物体说话时,人们最感困扰的似乎是自我意识问题。我们跟狗和金丝雀讲话的时候,觉得非常自在,但是和门把手或灯柱说话,就会觉得怪怪的(除非你烂醉如泥)。难道我和烤箱说话的时候会不觉得傻乎乎吗?大概跟对着电话应答机讲话半斤八两吧。

小型化(miniaturization)的趋势将使今天的语音输入比过去更遍及于每一个角落。电脑正变得越来越小,昨天还占据了整个房间的电脑设备,今天已出现在你的桌面上,明天你更可以把袖珍型电脑戴在手腕上。

许多桌上型电脑用户都不能充分认识过去10年来电脑体积的缩小幅度,原因是电脑体积的变化包含不同的方面,例如键盘的尺寸仍然尽可能保持不变,而显示器反而变大了。因此,今天桌上型电脑的整体大小仍和15年前的苹果型机不相上下。

如果你已有很长时间未曾使用调制解调器,调制解调器大小的变化更足以说明真正的变化有多大。不到15年以前,一个速率1200波特的调制解调器(价格约1000美元)几乎像一个侧躺的烤箱一样大。当时,速率9600波特的调制解调器就像一个放在架子上的大铁笼子一样。然而到了今天,你可以在一块智能卡上找到速率为19200波特的调制解调器。即使已经把调制解调器做成倍用卡般大小,我们仍然有许多空间没有好好利用,现在的设计有相当部分纯粹是为了外型的缘故(为了填满插口,或是大得让我们能握住,而不会随便弄丢)。我们所以没有把像调制解调器这样的东西装在“大头针头”上,主要不是技术上的原因,而是因为我们很容易把大头针随手乱放,再找起来很困难。

一旦挣脱了手指张开幅度的束缚(手指张开的幅度决定了一个舒适合用的键盘的形状和大小),电脑的大小就会更多地受到衣兜、钱夹、手表、圆珠笔和其他类似物品的体积的影响。在这种种形式中,信用卡很接近我们想要的最小尺寸,显示器很小,因此图形用户界面变得没有多少意义了。

笔形的系统很可能被视为笨拙的过渡期工具,既太大,又太小。按钮式的设计也不理想。看看你的电视机和录像机遥控器,你就会明白按钮的局限所在:按钮式装置完全是为手指纤细、眼力极佳的年轻人设计的。

由于以上种种原因,小型化的趋势必然会推动语音制造和语音识别技术的提高,并促使语音识别成为附在小型物体上的电脑的占支配地位的人机界面。实际的语音识别系统不需要一定装在袖扣和表链中。小型装备可以通过通信而提供帮助。关键在于,小型化了以后,就必须靠声音驱动。打电话,传心曲

很多年以前,霍尔马克卡片公司(Hallmarkcards)开发部的主任告诉我,他们公司主要的竞争对手是AT&T。“打电话,传心曲”的广告词说的是,透过声音,传达感情。声音的渠道不仅传递了信号,同时也传递了所有伴之而来的理解、深思、同情或宽容。我们会说,某人“听上去”很诚实,这个论点“听起来”不怎么可靠,或某件事“听起来”不像那么回事。声音中潜藏了能唤起感觉的信息。

同“打电话、传心曲”一样,我们会发现我们也将能通过声音把我们的希望传达给机器。有些人会表现得像教官一样未教导他们的电脑,另一些人则会用理性的声音。说话和授权密不可分。你会不会对七个小矮人发号施令呢?

有可能的。20年后,你可能对着桌上一群八英寸高的全息式助理说话。这种预想一点也不牵强。可以肯定的是,声音将会成为你和你的界面代理人之间最主要的沟通渠道。

6、少就是多老练的英国管家

1980年12月,魏思纳和我在鹿内信隆(《产经新闻》、富士电视台前会长)可爱的乡间别墅作客。别墅位于日本的箱根地区,离富士山不远。我们深信,参与媒体实验室的创建将使鹿内先生的报纸和电视传媒王国获益良多,因此他会乐于资助媒体实验室的创办。我们更进而相信,鹿内先生个人对现代艺术的兴趣,将和我们试图融合科技与艺术表现、把新发明与对新媒体的创造性应用结合在一起的梦想不谋而合。

晚餐前,我们一边散步,一边欣赏鹿内先生著名的户外艺术收藏,这里在白天是箱根露天美术馆。当我们与鹿内夫妇一起共进晚餐时,鹿内先生的私人男秘书也在一旁陪同。鹿内先生对英文一窍不通,他的秘书却能说一口漂亮的英语,在我们的沟通中担任重要的角色。魏思纳先打开话头,说他对卡尔德的作品很有兴趣,然后介绍了麻省理工学院和他自己?

已完结热门小说推荐

最新标签