谷歌

虽然消费数码行业喜欢用「爱与和平」来包装自己,但消费数码产品的厮杀其实异常残酷和不公:有些产品在被证实存在之前就已经掀起了轩然大波——比如Apple的VR/AR/MR设备,而有些产品在被品牌「判死刑」之前就已经被大众遗忘——比如今天要说的Google Glass。

2023年3月15日,Google于Google Glass产品页面刊登告示称:

感谢您过去十多年的创新和陪伴,自2023年3月15日起,我们将不再销售Glass Enterprise Edition(Google Glass企业版,下文简称为Glass企业版)。在2023年9月15日之前,我们将继续为Glass企业版提供技术支持。

来源:网络

没错,Glass企业版又要死了。为什么要说又?因为早在2015年,Google Glass项目就已经死过一次了,只不过在Google在2017和2022年又被Google反复「秽土转生」而已。不过从近年来Google对这种花钱不讨好的项目的态度来看,Google Glass这起怕是真的要「入土为安」了:

尽管你生前并不是一副合格的眼镜,甚至不一定有传统意义上的镜片,但你在推动AR眼镜发展的进程中依旧做了不可磨灭贡献。我们不会想念你,但现在你终于可以和另外两百个被Google关闭的项目一起安度余生了。永别了,Google Glass。

除非未来Google又一次把你拉起来打复活赛。

不过话又说回来,既然Google早在2014年就推出了第一代Google Glass(当时还叫Google Project Glass),那按照常理,Google在AR和MR领域应该积累了大量的经验,而这样的产品在MR概念「风生水起」的2023年应该非常吃香才对,为什么Google还得要对Google Glass下手呢?

来源:google

图片来源:Google

原因其实很简单,Google Glass根本就不是现代意义的AR设备。

由于Google Glass这个东西过于冷门,别说亲自体验了,可能很多人不知道这个产品长什么样。所以在解释为什么「寿终正寝」是Google Glass最好的结局之前,不如我们先回到2012年,看看当时的Google Glass是如何意气风发的。

「高」开低走的Google Glass

2012年7月,谷歌在Google I/O上「唐突」地插入了一段直播画面:几名翼装跳伞运动员在旧金山上空准备跳伞。不过这个直播画面抖动非常严重,看起来并不像由专业运动相机拍摄的。机舱门拉开,运动员依次跃入旧金山4000英尺的高空,在一系列花里胡哨的特技表演后,运动员们降落在一座建筑物附近,我们跟随画面视角骑上了自行车、穿过一个走廊、推开一扇门……然后就来到了Google I/O的会议室现场。

来源:google

图片来源:Google

没错,这场协调了旧金山市场办公室、警察与消防部门、NASA实验室和FAA联邦航空管理局的「空中直播」,由运动员佩戴的Google Glass拍摄直播。

高,实在是高,创意、效果和海拔三个维度都高。

凭借这一套足以列入数码产品发布会发展史的精彩操作,Google用最短的时间和最直接的方式向外界展示了Google Glass的功能,同时也赢得了在场观众的掌声。而Google Glass这个两边镜腿「发育不均衡」,甚至没有传统眼镜镜片的「眼镜」形象,也伴随着这次跳伞活动被全世界科技爱好者铭记。

就像Google Glass没有给「Glass」一词用复数形式一样,当时的Google Glass只有一个镜片——一个小小的,固定在原本右眼镜片右上角的一个小玻璃「柱」,这个经过特殊设计的透镜可以反射右侧镜腿中的屏幕所显示的内容。

来源:google

图片来源:Google

简单来说,Google Glass就是一个固定在用户眼前的、面积特别小的HUD。虽然Google也推出了光学镜框版本的Google Glass,允许用户为Google Glass配置适合自己度数的镜片,但由于Google Glass显示的内容只出现在那个特别小的镜片中,这也导致Google Glass并不能算作符合现代定义的AR眼镜,只能说是一个光学头戴显示器(OHMD)。

来源:google

图片来源:Google

2013年,Google开始有条件地以1500美元的价格为开发者和「极端Google粉丝」提供Google Glass,尽管开发者都表示这玩意拥有「近乎无限」的潜能,但受到当时显示、音频以及电池技术的限制,即使Google Glass运行的是开放的Android系统,为Google Glass开发、适配、优化的App依旧不见踪影。

一边是可遇而不可求的购买机会和1500美元的高昂售价,一边是近乎鸡肋的内置App和不尽如人意的显示效果,很快大家就找到了Google Glass的真正用处:戴着自拍来彰显自己的科技气息。如果大家对当时的科技数码圈有印象,应该在不少「科技爱好者」的头像图片中见到过借来拍照的Google Glass。

也因为相同的原因,Google在短短一年后就终止了对一般开发者与用户的Google Glass项目。不过对于那些能承担得起使用Google Glass成本的大型企业,Google也给他们留了一条名为「共同开发」、写作「拉上贼船」的路:2017年,Google Glass企业版发布,首批客户包括多个知名美国企业,比如波音、通用航空。

但很可惜,比Google Glass更便宜、更好用、更通用的HTC Vive,在2016年就以799美元的售价全球发售了。

Google Glass为什么行不通?

跟划时代的HTC Vive相比,Google Glass除了不需要插着线使用外,几乎处处都是短板。这其实也可以理解,毕竟从2012年到2023年,每一代google Glass都没能脱离谷歌在2012年定下的框架:一个眼镜、一个摄像头和一个独立的显示模组。

由于2012年的技术限制,Google Glass在一开始并没有按照一个独立设备来设计。与其说它是一个佩戴在头上的智能手机,倒不如说他更像一个挂在用户眼前的透明屏幕智能手表:你可以用它来看天气、看导航信息,甚至完成接电话这种简单的交互——Google Glass在右侧镜腿处加入了一个触控板,可以支持一些简单的点击和滑动交互。

但如果你想设置到某个地方的导航、或者看完后回复邮件,很遗憾,还是得套智能手机。而这一套产品逻辑居然一路延续到了2023年。在这个VR一体机横行,连智能手表都讲究独立运行的大环境下,Google Glass居然还在坚持着十年前定下的产品架构,属实是与时代脱节了。

过于复古的产品理念让Google Glass与时代脱节,而对OHMD路线的坚持也让Google Glass在无法乘着AR的风口快速前进。但真正为Google Glass宣告死刑的,其实还是Google心心念念的企业服务。

从表面看,Google终止Google Glass项目是因为大环境不好,像「X部门」(Google X实验室经Alphabet结构重整后的名字)这种烧钱不讨好的「吞金部门」需要缩减人手。但失去来自企业用户的兴趣和关注,在我看来才是Google停掉Google Glass项目的根本原因。

来源:google

图片来源:Google

在前几次「秽土转生」时,Google Glass就已经决定专做企业用户的大生意了,这也是第二代Google Glass直接被命名为Google Glass Enterprise Edition的原因。根据介绍,Google也确实找到了通用航空、DHL、波音、福特甚至是IKEA等大型企业进行合作。

此时,Google对Google Glass实行的是「项目」化的销售模式,即为企业客户提供包括硬件设备和配套软件服务的一站式服务方案。这种销售模式的好处在于相关企业可以「开箱即用」,但缺点也同样明显:尽管Google Glass不是嵌入式开发设备,但Google针对大客户的销售模式却让Google Glass看起来像是一锤子买卖。

再加上Google Glass本身在功能和通用性上表现不佳,与其使用过时且不一定好用的Google Glass,倒不如直接采用通用性更强的AR设备。毕竟MR已经成为未来新方向,市面上为MR硬件提供相关技术支持的企业只会越来越多。

而Google Glass企业版,用一个不太准确的话来说,「就像一台不能升级、不能破解、坏了只能重新买的iPhone 7」。

如果情况属实,那为Google Glass给予所谓的「临终关怀」其实也有一定的道理。

前无古人,后有来者

虽然Google Glass最终还是逃不掉被Google关闭的宿命,但无论我们怎么评价它,Google Glass仍然是AR技术当之无愧的开拓者。它的出现让人们看到了AR技术的巨大潜力,看到了AR技术的潜力和应用前景,并让更多的人开始思考AR技术能够带来什么样的变革。

而Google Glass「之死」,也再次向市场证明了硬件、内容和使用场景三者缺一不可的铁律。无论VR、AR还是MR都需要更好的用户体验、更多的应用程序和生态系统支持,才能真正被消费者和企业认可。

致此,Google Glass的使命才真正结束。

本文为转载内容,授权事宜请联系原著作权人。

阅读全文>>

这个春节假期,久违的年味儿十足。国内万家灯火热热闹闹辞旧迎新,海外科技行业却是风云诡谲,巨震一波接着一波不见消停。 

裁员潮引发的混乱局面持续发酵:短短十天之间,微软宣布裁员10000人、谷歌母公司Alphabet宣布裁员12000人、IBM宣布裁员3900人、SAP宣布裁员3000人……大型科技公司们正效仿此前经济衰退时期的做法,试图通过大规模裁员以及削减一些暂时无利可图的项目,来应对当下的经济动荡。 

云计算已是这些科技巨头维系长期增长的必竞之高地。同时谷歌与微软正在人工智能(AI)内容生成战场展开新一轮的较量。春节期间,微软与研发出ChatGPT的OpenAI宣布升级合作,将投资数十亿美元加速AI研究突破与落地部署。 

迄今仍未公布大规模裁员的苹果,被继续爆出其首款MR头显的更多新料,这款苹果“七年磨一剑”的跨时代之作将在今夏登场,预计售价约3000美元、今年卖出100万台。此外苹果生产线的东南亚迁移继续生变,两家“果链”大厂宣布2023年将扩大东南亚产能。 

复工第一天,为你梳理了这个春节值得关注的三个重大科技要闻。 

01.裁员风暴持续

1月海外科技大厂裁员逾5万人

春节假期前后,微软、谷歌、IBM、SAP等科技公司先后加入裁员潮。 

加上1月4日云服务SaaS龙头Salesforce宣布的裁员8000人、电商及云计算巨头亚马逊宣布的裁员18000人,海外科技巨头在今年1月份公布的裁员数总计已经超过5万人。 

根据Layoffs.fyi网站统计的数据,2022年,全球科技行业裁员超过15万人;2023年初至今,超过200家科技公司已经裁员逾6.8万人。 

1月18日,微软宣布计划到2023财年第三季度末裁员10000人,这是其八年多来最大规模的裁员,约占微软22万名员工总数的4.5%。根据外媒的爆料,微软的MR头显、视频游戏等业务将受此次裁员影响。 

紧接着1月20日,谷歌母公司Alphabet宣布了其25年历史上最大规模的一轮裁员——将在全球范围内裁员1.2万人,约占全职员工的6%。据悉,有750名高管参与了裁员过程,花了数周时间了决定将哪些员工解雇,同时谷歌也将削减高管薪酬,包括大幅削减所有高级副总裁的年终奖。 

1月26日,IBM宣布将裁员约3900人,约占其28万名员工的1.4%。一位发言人称,此次裁员将主要针对IBM去年剥离的IT服务业务Kyndryl及其医疗健康业务,IBM将从中承担约3亿美元的费用。 

同日,德国商业软件巨头SAP宣布在2022年底利润大幅下滑后将裁员3000个职位,预计影响其全球员工的约2.5%。去年SAP大约雇用了11.1万名员工,相比2021年的10.4名员工增加了逾6600人。 

裁员风暴虽然突如其来,但并不令人意外,这都是科技巨头高速扩张后的紧急“刹车”。 

在截至6月的上一财年,微软增加了40000名员工;在2022年前9个月,Alphabet增加了30000多个工作岗位,Meta增加了15000多人。去年11月,Meta宣布将裁员11000名员工。 

苹果是美股五大科技巨头中唯一还未公布任何大规模裁员讯息的科技公司,其上一次大规模裁员还是在1997年,当时苹果联合创始人乔布斯重返公司,裁掉4100名员工来节约成本。 

不过在这个春节期间,苹果也被外媒曝出已裁掉一些Apple Store及零售渠道的非季节性员工。 

02.云计算战况升温,AI内容生成商战在即

对于亚马逊、微软、谷歌、IBM、SAP等软件巨头来说,云计算业务正变得越来越重要。同时,谷歌和微软正在AI内容生成领域开展日趋激烈的竞争。 

面对宏观经济的不确定性,许多企业计划管理云计算成本,致使对商业软件及云服务的需求降温。坐拥全球第二大云平台的微软在上个季度录得六年多以来的最慢销售增长。根据1月24日微软发布的最新财报,其截至12月31日的2023财年第二季度营收同比增长2%至527亿美元,净利润同比下降12%至164亿美元,增长率创自2016年6月以来的新低。 

智能云业务已经是微软最大的营收支柱,第二季度营收增长18%至215亿美元,约占其总收入的40%。其中Azure云平台业务的增幅达31%。不过微软CFO Amy Hood警告说,Azure业务的增长在年底放缓,未来几个月预计将进一步放缓。 

无论是IBM还是SAP,近年来都在将公司从传统基础设施或信息技术服务业务,转向快速增长且更加有利可图的云计算服务。2022财年,IBM全年收入同比增长6%至606亿美元,其中混合云收入增长11%至224亿美元。SAP的云业务收入亦强劲增长,2022财年同比增长33%至125.6亿欧元。 

微软押注下一波云服务需求将来自AI,并因对顶尖AI初创公司OpenAI的投资加码而备受关注。 

去年OpenAI发布的聊天机器人ChatGPT风靡全球,因其神乎其技的精准问答、公文写作、辅助编程等能力,被业界盛赞可能威胁到以谷歌搜索为代表的搜索引擎。1月17日,OpenAI宣布微软很快将把ChatGPT加入Azure云服务。微软正持续提供更广泛的OpenAI模型的开放访问。 

从2021年至今,微软的云客户已经可以通过付费访问到OpenAI的GPT-3大模型,用户也可以通过微软Bing搜索引擎获得OpenAI的另一爆款AI文本生成图像模型DALL·E 2的创作能力,早先ChatGPT也被传将在今年3月底前为Bing的一些搜索查询提供答案。 

1月23日,微软宣布和OpenAI的长期合作伙伴关系进入第三阶段,将投资数十亿美元,加速前沿AI研究的突破和推进OpenAI模型在各产品中的部署,并强调Azure是OpenAI的 独家云提供商 。 

根据此前外媒的追踪报道,OpenAI在2023年的收入预计将达到2亿美元,到2024年将达到10亿美元。而作为OpenAI的主要财务及算力支持方,微软显然将从OpenAI技术带来的可观收入中获益。 

微软和OpenAI分别是谷歌在云计算、搜索引擎和前沿AI研究领域的主要对手,前两者在推进AI内容生成走向商业化方面的活跃行动,也令人们愈发关注具备相近技术储备的谷歌如何迎敌。 

据外媒报道,谷歌管理层已经发布“红色代码”警报,加强在AI生成艺术作品等方面的研发工作。尽管谷歌一直在磨练其聊天机器人LaMDA,但它对聊天机器人与搜索引擎的融合至今仍持谨慎态度,担心一些悬而未决的纰漏可能对自身声誉造成损伤。 

AI内容生成带来的新商机已经蔓延到媒体行业。美国时间1月26日,“美版今日头条”BuzzFeed宣布未来将使用OpenAI ChatGPT帮助创作内容,并透露今年AI内容创作将从研发阶段转变为核心业务的一部分。消息公布后,BuzzFeed的股价连续多日大涨。 

2023年,AI内容生成的商业化进程将进一步提速。我们可能正在见证一类伟大的新式科技工具的蕴育与成长。多年后,云计算与AI内容生成模型形成的合力,将颠覆传统写作、创作、编程开发的效率,对社会生产力的跃迁产生深远影响。 

03.苹果MR头显再爆猛料,“果链”大厂密集下南洋

相比其他深陷寒潮的科技巨头,苹果的日子还算好过,2022年第四季度不仅在全球智能手机出货量排行中一举夺魁,其季度营收与净利润也均保持住正增长,iPhone、Mac、可穿戴及智能家居产品线的季度营收均创新高。 

2023年苹果备受期待的新品,除了将在秋季首发3nm芯片的iPhone 15系列手机外,便是苹果CEO库克酝酿已久的“秘密武器”——MR头显。 

这个春节,呼之欲出的苹果MR(混合现实)头显被爆出更多猛料,包括可能被命名为“Reality Pro”、售价约3000美元、希望首年销售100万台等。也就是说,如果能达成目标,这款全新品类今年将给苹果贡献30亿美元的收入。 

根据外媒的报道,眼动和手部追踪功能将是苹果MR头显的主要卖点。相较当前多数VR头显依赖手柄操作,用户能通过控制视线和手指动作来直接操纵苹果MR头显上的任务。另外苹果首款MR产品可能会配备4K OLED屏幕,搭配15组摄像头模组,拥有3D版iOS界面、分AR/VR模式等。 

不过,MR头显能否成为苹果下一个现象级爆品尚难定论。按照外媒的爆料,其首款头显预计是一款主要面向专业人士及开发者的高端产品,能否引起专业人群的追捧还要等市场给出答案。 

除了新品爆料不断,苹果生产线向东南亚地区转移的趋势也在春节期间动向频频。 

随着苹果加速推进其供应链全球化策略,春节前,两家“果链”大厂富士康、和硕都在公司活动中表示2023年将继续扩大在东南亚的制造规模。富士康、和硕现已在印度生产苹果部分型号的iPhone手机。 

早自2018年开始,这场“果链东南飞”的迁徙已经拉开序幕,立讯精密、歌尔股份、蓝思科技、伯恩光学、纬创等来自中国的“果链”企业纷纷跨洋越海,在越南、印度安营扎寨。 

近期印度贸易部长公开表示,当前约有5%~7%的苹果产品是在印度制造的,其目标是将这一比例在未来几年提升至25%。市研机构DigiTimes Research则给出了更激进的预测,认为到2027年印度制造有望占到苹果iPhone全球产能的45%~50%。 

除了印度之外,苹果还有意将Mac系列产品的生产线迁移至越南和泰国,此前越南已经是Apple Watch智能手表、iPad平板电脑、HomePod智能音箱等产品的一个生产基地。 

这场“果链东南飞”,恐怕一去难复回。 

04.结语

总体来看,大型科技公司们无论是掀起裁员风暴,还是收紧资源聚焦到云计算、AI、MR投资等更具长期前景的投资,抑或是加强供应链弹性的布局,都是在消解疫情期间留下的“后遗症”。 

对于整个行业来说,这是一场自然而然的调整。此前这些公司的掌舵者过于乐观地预估了市场形势,在一些大胆豪赌上激进扩张挥金如土,如今遭逢全球经济衰退,又转向谨慎行事、缩减开支。考虑到日益紧张的劳动力市场,被大厂裁掉的技术人才可能很快就会被其他需要补充技术实力的企业吸收。 

混乱的2022年给许多行业都上了一堂刻骨铭心的居安思危大课。新的一年依然充满不确定性,科技公司们正在稳中求进,通过更加谨慎的投资蓄力,等待需求复苏拐点的到来。

本文为转载内容,授权事宜请联系原著作权人。

阅读全文>>

谷歌正试图训练出更像人类的机器人。

智东西8月17日报道,谷歌刚刚公布一项重磅研究进展:通过结合更强大的人工智能(AI)大型语言模型,进一步提高机器人的“智商”。

研究人员表示,这是第一次将大型语言模型集成到机器人中,“是一种非常不同的范式”。

就像人类一样,机器人能响应完整的命令。换句话说,你不再需要像以前那样分步地发出一连串简短指令,一步一步指导机器人的每个动作。

谷歌研究人员做了个演示,对机器人说:“我饿了,你能给我点零食吗?”

接着,机器人在自助餐厅中搜索一番,然后打开一个抽屉,找到一袋薯片并将它拿给研究人员。

当然了,拿汽水也是不在话下。

▲机器人演示拿起物品的能力

这是一项雄心勃勃的技术突破,为多用途机器人铺平了道路,使其像以往的扫地机器人、巡逻机器人等单一任务机器人一样易于控制。

谷歌在本周二发布的博文中,详细介绍了这项研究进展,通过结合更复杂的语言模型,机器人执行命令的成功率从61%提高至74%。


用大模型提高理解能力,让机器人不再是“铁憨憨”


指挥机器人干活不是什么新奇的事,但要让机器人能够理解你的命令背后的意图,那就要考验它的“大脑”好不好用了。

比如,当你问机器人:“我把饮料洒了,你能帮忙吗?”谷歌机器人可以迅速筛出适配指令的合适行动,然后从厨房拿块清洁海绵来。

但假如你只是惊呼:“完蛋!我的饮料!”那么常见的机器人通常毫无反应,这时候,如果有一个智能机器人听出你的话外音,主动帮你清洁,那它才是真正聪明的机器人。

这些看似简单的感知技能,实际上是最具计算挑战性的任务类型。

以前,机器人系统只能执行简短、明确的指令,例如“拿起一个苹果”、“往前走两步”。

机器人往往在明确具体的任务和奖励下表现最好,但在学习执行多步骤任务和推理抽象的、模棱两可的指令方面遇到困难。

比如,你问机器人:“我刚刚锻炼过,可以给我拿一份健康的零食?”机器人可能很难理解这句话里的细微表达差别和微妙之处。

虽然近年来大型语言模型进展飞速,取得许多令人印象深刻的结果,很多语言模型在特定领域的知识储备已经远超人类,但很多语言模型的训练并没有基于物理世界的数据,通常不会跟环境产生直接交互,也不会观察其响应的结果。

这可能导致语言模型生成的指令,会让在现实环境中运行的机器人做出不合逻辑、不切实际或者不安全的行动。

我们还用刚才提到的问题举例,问机器人:“我把饮料洒了,你能帮忙吗?”

经典的OpenAI大模型GPT-3会提供一个建议:“您可以尝试使用真空吸尘器。”

谷歌AI系统LaMDA会回答:“您想让我帮忙找个清洁工具吗?”

另一个谷歌FLAN语言模型则会直接道歉:“对不起,我不是故意的。”这显然是个没用的回应。

因此,谷歌研究人员提出设想,有没有一种有效的方法,能够将高级语言模型的语言理解能力和机器人系统擅长的处理感知和交互能力相结合,同时利用两者的优势?

这就是谷歌正与谷歌母公司Alphabet的机器人子公司Everyday Robots合作研发的新方法——PaLM-SayCan。


用语言模型做“大脑”,机器人充当“手”与“眼”


谷歌研究人员称,将PaLM-SayCan集成到机器人中后,机器人通过使用思维链提示和执行请求所需的分步解决方案,能更好地执行复杂、抽象的任务,根据自身能力权衡接下来最合适的执行步骤,并实现高度可解释的行动结果。

“我们发现它(机器人)甚至能处理16个步骤的指令。”研究人员说。

引入PaLM-SayCan后,语言模型可以帮助机器人更好地理解运用到高级语义知识、需要进行推理的指令,使其与人类、与物理环境的互动更自然。反过来,机器人可以充当语言模型的手和眼,通过与真实环境的不断交互为语言模型提供更多的经验。

具体是怎么做的呢?

PaLM-SayCan方法使用PaLM语言模型(Say)中包含的知识来确定和评估对高级指令有效的动作,它还用到Affordance功能(Can),来支持现实世界并确定在给定环境下可执行哪些操作。

这个系统可以看作是用户和机器人之间的对话平台。用户首先发出一个指令,语言模型将其拆解成方便机器人执行的一系列明确步骤。

然后,机器人对这些步骤进行筛选,通过评估确定在其当前状态和环境下最可行的行动计划,从而完成相应任务。

该模型通过将两个概率相乘,来确定特定技能成功学习的概率:一是task-grounding,即技能语言描述;二是world-grounding,即当前技能的可行性。

由于PaLM-SayCan方法拥有较好的可解释性,用户可以通过查看单独的语言和可视性分数,来轻松理解决策过程。


洒了饮料,机器人帮忙清理分几步?


如可视化界面所示,PaLM-SayCan执行复杂任务的行为是可解释的,这将使机器人的交互过程更加安全可控。

比如当你洒了饮料,请求机器人帮忙时,你可以看到它是如何做出决定,为执行任务选择最合适的步骤的:找到可乐罐,拾起可乐罐,走到垃圾桶旁边,放下可乐罐,找到一块海绵,拾起海绵,走向桌子,放下海绵……

蓝色显示的是语音模型分数,即语言模型判断技能有用的概率;红色是affordance分数,即系统成功执行技能的可能性;绿色显示的是用于最终决定执行技能的综合分数。

PaLM-SayCan方法将语言模型的概率和价值函数(VF)的概率相结合,以选择下一个要执行的技能,重复这个过程,直至高级指令成功完成。

研究人员使用基于图像的行为克隆(BC)来训练语言条件策略和基于时间差异(TD)的强化学习方法来训练价值函数。

智能体技能库中,训练策略和价值函数的每个技能都会被定义为一个具有简短语言描述的策略,用嵌入表示,以及一个指示从机器人当前状态完成技能概率的affordance函数。

为了学习affordance函数,研究人员使用稀疏奖励函数,设置为1.0表示成功执行,0.0表示未成功。

训练策略方面,研究人员从10个机器人在11个月内执行的68000次演示中收集了数据,并从一组自主学习的策略片段中筛选了12000次成功的片段,然后在Everyday Robots模拟器用使用MT-Opt学习语言条件值函数,通过使用演示来引导模拟策略的性能,以提供初步成功,再通过模拟中的在线数据收集来持续改进强化学习性能。


走向通用机器人时代


为了测试其方法,研究人员使用了与PaLM配对的Everyday Robots机器人,将机器人放在有各种常见物体的厨房环境中,用101条指令对其进行测试。

这些指令不是简单的命令式查询,而是涵盖了语言常有的歧义性和复杂性。

研究人员用两个指标来评估系统的性能:(1)规划成功率,表示机器人是否为指令选择了正确的技能;(2)执行成功率,表示机器人是否成功执行了指令。

他们比较了PaLM和FLAN两种谷歌大型语言模型、有和没有affordance grounding以及直接使用自然语言运行的底层策略。

结果显示,使用带有affordance grounding的PaLM(即谷歌PaLM-SayCan)系统在84%的时间内选择了正确的技能序列,并在74%的时间内成功执行这些技能序列。

▲当与PaLM结合使用时,SayCan展示了101条测试指令中84%的成功规划

与FLAN以及没有robotic grounding的PaLM相比,PaLM-SayCan的错误减少了50%。同时,相较此前的FLAN-SayCan方法,PaLM-SayCan的执行成功率提升了13%。

“这特别令人兴奋,因为它代表着我们第一次可以看到语言模型的进步如何转化为机器人技术的类似改进。”谷歌研究人员在技术博客中写道。

研究人员相信,这项研究将推动从执行简短、明确的制定命令的工业机器人,过渡到可以处理更复杂和抽象命令的通用机器人时代。

不过由于谷歌没有公开101个命令的完整列表,所以这些命令是否覆盖家庭机器人所需理解的绝大部分语言广度和复杂性,还不好下定论。

谷歌研究人员还开源了一个机器人模拟设置,希望提供宝贵资源用于将机器人学习与高级语言模型相结合的未来研究。

GitHub链接:http://say-can.github.io/

未来,他们希望更好地了解利用机器人的真实世界经验获得的信息来改进语言模型,以及自然语言在多大程度上是编程机器人的正确本体。


科技巨头对机器人研发兴趣浓厚


谷歌母公司Alphabet对研发机器人布局已久。

2013年,谷歌一连收购了几家知名机器人公司,包括机器人领域“最出圈”的波士顿动力。不过后来波士顿动力几经转手,先是被谷歌卖给日本电信和科技投资巨头软银,后来又被软银卖给了韩国汽车巨头现代。

此前Everyday Robotics打造的机器人已经在谷歌内部执行一些简单任务,比如送零食、倒垃圾、擦拭柜台。

Everyday Robotics项目仍处于起步阶段,机器人行动比较缓慢,做事也没那么果断灵巧。不过随着这些机器人借助谷歌大型语言模型提高理解能力,它们将进一步提高执行力。

除了谷歌外,多家大型科技公司都对机器人技术展现出浓厚的兴趣。

一个典型的代表是美国电商巨头亚马逊,它在仓库中使用了许多机器人,并且正在试验无人机送货。这个月初,亚马逊还宣布计划以17亿美元收购扫地机器人鼻祖iRobot,此次收购也将成为亚马逊史上第四大巨额收购交易。

就在上周,国内智能手机制造商小米公布了其研发的人形机器人“铁大”,去年它还推出了一款机器狗“铁蛋”。

除此之外,美国电动车龙头特斯拉也在研发通用机器人,并将在9月30日发布其首款人形机器人“擎天柱”原型机。

据特斯拉创始人兼CEO马斯克透露,“擎天柱”将是一款非常友好的机器人,能替代人类执行一些从事危险、重复、无聊的任务,包括拿扳手给特斯拉电动车装螺丝,或者帮人类买菜、做饭、照顾老人,而且未来其成本比汽车还要便宜。

▲特斯拉“擎天柱”的部分参数


结语:距离高智能机器人,还有很长的路要走


多年来,用AI技术训练机器人屡有突破,但大的进展仍然缓慢。而引入语言模型的方法,或许可以帮助机器人进一步提高解决复杂问题的能力,从而替代人类从事更多重复性劳动。

谷歌的这一探索,展示了机器人技术与大型语言模型进步结合的更多可能性。

目前真正大范围渗透进人们日常生活空间的家庭机器人,仅有清洁机器人这个品类,但在AI、激光雷达等技术的辅助下,随着机器人提高视觉、导航等技能,更多新型机器人将进入家庭场景。

当然,迄今的机器人研发,距离我们想象的十项全能“机器人管家”,还有很长的路要走。

语言模型固然可以为机器人提供更好的步骤规划评估和选择,但它们还做不到事无巨细地提供所有信息,比如不能告诉机器人打开冰箱时应施加多大的力。谷歌研究人员也暂时没有将PaLM-SayCan商业化的计划。

围绕机器人创新技术及商业化落地成果,智东西将在明日举行的2022世界机器人博览会现场发来更多一线观察报道,欢迎关注。


本文为转载内容,授权事宜请联系原著作权人。

阅读全文>>

我看好谷歌(GOOGL)因为其云计算和搜索业务持续增长,以及其产品管道中的重大未来增长计划。22年第一季度,YouTube广告收入同比增长14%,比市场预期低7%。收入增长的这种拖累可以归因于流媒体领域的激烈竞争和俄乌冲突。

尽管没有达到最高收入,但管理层似乎对短视频给谷歌带来的机会持乐观态度。尽管恢复了面对面的互动,该公司在YouTube上的参与度/时间仍保持强劲增长。此外,YouTube付费订阅量大幅上升。

谷歌继续看到其核心搜索收入业务的优势,超出预期,尽管宏观因素仍在造成影响。这表明了广告市场潜在的弹性数字性能趋势。此外,云仍然是科技公司的可靠收入来源。谷歌云是22年第一季度的主要增长动力,创造了58亿美元的收入(同比增长44%)。这些细分市场的增长导致谷歌授权额外回购700亿美元的A类和C类股票。


YouTube的弱点被夸大了

由于谷歌决定暂停在俄罗斯的运营,YouTube的广告收入受到了负面影响。2021年,谷歌约有1%的营收来自俄罗斯,主要为广告收入。这场冲突可能会继续拖累未来几个季度的广告收入。广告收入同比增长14%,比市场预期低7%。这一细分市场的其他收入增长了5%,反映了YouTube音乐、Premium和 TV 的订户增长。

谷歌仍处于YouTube部分货币化的早期阶段,确定什么样的价格点将优化该平台的用户增长。由于通胀压力,谷歌很可能在2023年提价。

谷歌的YouTube可能在YouTube广告收入方面经历了一个艰难的季度,但该公司继续在该细分市场的其他领域看到增长。22年第一季度,YouTube音乐、Premium和TV的收入同比增长5%。这一增长被Play Store收入的下降所强烈抵消,这归因于1月1日实施的价格变化,谷歌将订阅应用商店费用从30%降至15%。这可能会在未来几个季度继续拖累YouTube的收入。

尽管逆风而行,我仍然认为YouTube是一项高价值的运营资产,在独立的基础上为投资者带来了好处。假设2022财年YouTube收入同比增长20%,达到440亿美元,我的估值模型使用6.8倍EV/2022E rev倍数对YouTube的估值为2992亿美元。这意味着,如果单独在纽交所交易,YouTube有20.51%的上涨空间(见下文)。

搜索收入

谷歌第一季度的搜索收入同比增长24%,超出华尔街分析师预期的 1%。尽管宏观经济形势不利,谷歌的搜索业务依然可靠。由于零售业和旅游业的积极趋势,这一细分市场是广告收入的最大驱动力。

随着世界继续从疫情中恢复正常,这些积极的趋势应该会继续下去,并支撑谷歌的搜索收入增长。此外,管理层指出,22 年第一季度的旅游搜索高于 2019 年疫情前的水平,度假租赁的查询增长同比增长37%。这种增长使Airbnb (ABNB)等公司受益,住宿公司上周强劲的财报说明了这一点。

云收入

对于科技公司来说,云产业仍然是一个可靠的增长来源。谷歌云收入同比增长44%,略高于分析师预期。这个细分市场有充足的利润增长空间。

通货膨胀对这一部分的影响微乎其微,地缘政治因素导致东欧的安全支出增加了5%-7%,而其他云支出保持不变。由于研发市场的大幅增长,该部门的EBIT利润率为-15%,但仍有机会将利润率提升至21财年的30%或更高水平。这些利润率的持续扩大将为谷歌带来强劲的自由现金流,使他们能够继续创新,并在内部为未来的增长计划提供资金。

股票回购

在22年第一季度的收益中,谷歌宣布其董事会授权进行700亿美元的股票回购。在21财年,谷歌授权了总额为500亿美元的股票回购,超过了除苹果之外的任何其他上市公司。谷歌的股票回购记录可以追溯到2019年,当时他们授权了250亿美元的回购。除非遇到任何重大挫折,否则在可预见的未来,谷歌似乎将致力于通过回购回报股东。

Waymo

谷歌有一个子公司,专门致力于创建改变世界的公司,这些公司最终可能成为下一个谷歌。这家子公司的一项举措是Waymo,它是谷歌在2009年创建的自动驾驶汽车。

Waymo可以通过提高道路安全、减少化石燃料和降低运输成本来带来革命性的变化。Waymo还与汽车制造商建立了多种合作伙伴关系,将该技术集成到每辆汽车中。

Waymo只是投资者应该购买谷歌股票的另一个原因。根据一家市场情报公司的数据,自动驾驶汽车市场预计将以22.75%的CAGR增长,其中最大的市场是北美(见下文)。今年3月,谷歌宣布正在旧金山扩大其自动驾驶汽车测试。他们正在向旧金山地区希望无人驾驶上班的员工提供全电动捷豹汽车。除了打车服务,Waymo还在努力向卡车运输领域扩张。

根据Waymo的网站,美国70%的货物是通过卡车运送的。在过去的一年里,货运公司受到了劳动力短缺的影响。更少的司机意味着更少的货运,这导致更低的销售额。自动驾驶汽车为卡车运输公司提供了劳动力短缺的解决方案。

此外,由于工资支出的大幅减少,卡车运输公司将倾向于转向自动驾驶汽车。谷歌已经与几家卡车运输公司建立了Waymo合作伙伴关系,包括J.B. Hunt。如果有足够多的卡车运输公司实施Waymo,劳动力短缺问题将得到缓解,劳动力成本将降低,交付效率将提高。

投资银行瑞银(UBS)预计,2030年无人驾驶市场的总价值将高达2.8万亿美元。他们还预测,Waymo将拥有无人驾驶汽车市场的60%。此外,瑞银预测,到2030年,Waymo本身的收入将达到750亿至1350亿美元,是YouTube单独收入的4倍。

贴现现金流模型

对于我的贴现现金流模型,我使用了分析师对22财年和23财年可调整EBITDA的一致估计。我假设2024财年和2025财年的收入CAGR为20%(见上文)。将这些假设输入我的DCF分析后,我得出每股的内在价值为3037.90美元(比当前价格2307.90美元高出30.42%)。关于成本和费用,我使用3年的历史平均值作为销售额的百分比。

过去三年,谷歌的平均收入成本为销售额的32.46%。他们的3年平均运营费用是销售额的29.84%。营业外支出占销售额的44%。资本支出占销售额的13%。最后,净营运资本的变化是销售额的5%。

对于我的贴现率,我使用GOOGL的当前市值和债务的当前市值计算出GOOGL的WAAC为8.73%(见下文)。为了计算GOOGL的权益成本,我通过计算8.5%的预期市场回报率和2.91%的无风险利率(10年期美国国债)之间的差异,得出了他们权益成本的5.59%的市场风险溢价。为了计算债务的市场价值,我使用了2021年的利息费用、21年的总债务(账面价值)和4年的期限。

在将 8.73% 的 WACC 应用于我对 MSFT 的预测未来现金流量后,我得出每股的内在价值为3037.90美元(如下图)。这比当前股价2329.31美元高出30.42%。我的目标价格低于华尔街12个月目标价格的中位数,从每股2840美元到4533美元不等。

投资风险

在投资GOOGL之前,有几个风险需要考虑。尽管消费者资产负债表处于健康状态,但衰退的风险正在稳步上升,而且可能迟早会到来。彭博认为当前经济衰退的概率为25%,而高盛更为悲观,高达35%。

鉴于地缘因素、通胀环境、高油价和潜在的公司税上调,这种可能性很快就会出现。鉴于消费者资产负债表的健康状况,下一次衰退有望不像网络泡沫或次贷危机那样糟糕。

由于谷歌的产品种类繁多,该公司面临着更大的竞争压力。一如既往,谷歌将继续主导搜索引擎市场,推动广告收入强劲增长。然而,该公司在竞争激烈的云和订阅流媒体市场中运营。云市场目前由亚马逊和微软主导,占总市场份额的50%。

此外,鉴于订阅流媒体领域存在过多不同的竞争对手,YouTube的收入可能会受到影响。这些竞争压力可能会导致谷歌在YouTube和云计算领域失去宝贵的市场份额。

结语

谷歌是搜索引擎行业的主导者,这让他们在广告方面有了可靠的收入来源。尽管有迹象表明YouTube的广告业务疲软,但该细分市场的其他领域仍有强劲增长,如用户参与度和订户增长。谷歌在他们的产品管道中也有几个可以带来指数回报的登月计划。Waymo处于主导自动驾驶汽车市场的有利地位,为谷歌提供了巨大的商机。

阅读全文>>

隐私安全已成为国内外互联网广告行业面临的最严峻挑战。

一年前,苹果ATT框架的实施已经让行业真实地感受到其中的冲击,连行业巨头Facebook都无力改变当下的趋势,不得不忍受巨额损失,重建广告系统以求隐私和效果双全的解决方案。

一年后,移动端生态的另一巨头谷歌也决定,将其之前探索的“隐私沙盒”(Privacy Sandbox)技术应用于安卓系统内,以限制安卓系统内的数据收集和跨应用追踪能力。这意味着,安卓系统也即将迎来一个隐私至上的时代。


撤销广告标识符,谷歌将“隐私沙盒”引入安卓系统

上周三,谷歌宣布将“隐私沙盒”技术引入安卓的计划,旨在打造一个更先进、隐私的广告解决方案,从而限制与第三方共享用户数据,并且在没有跨应用标识符(包括广告ID)的情况下运行。同时,谷歌也在试图通过技术手段降低私密数据收集的可能性,比如以更安全的方式对接APP与广告SDK。

“隐私沙盒”是最初谷歌在2019年公布的一项隐私保护计划。当时正值谷歌浏览器宣布关闭第三方cookies之后,“隐私沙盒”就是其给出的替代方案,目的是通过建立一系列工具和技术手段,限制广告主采集用户数据,在不获取数据的情况下还能做到定向投放,维护用户隐私安全的同时保证广告效果。如今,距离第三方cookies正式禁用还有不到1年的时间,“隐私沙盒”的解决方案已开始在安卓系统上开发落地,预计在2022年末运行测试。

经历了第三方cookie废除、苹果IDFA受禁等一系列事件后,很多人已经意识到,安卓系统的“禁令”也许不会立刻到来,但也不会太远。谷歌也表示这将是一项多年的计划,需要与全行业开发者共同合作努力才能完成,并保证目前安卓手机的设备标识符还能继续使用两年。

类似于苹果的IDFA,每台安卓设备上都有一个独一无二的标识符,即“Advertising ID”,又称为“GAID”,通过标识符,广告主就能够采集用户信息,并向用户定向推送应用内广告。而当安卓系统也迎来隐私变革,意味着GAID也即将退出历史舞台。

其实,早在去年,谷歌就开始针对广告标识符增加了一系列隐私保护机制。例如当安卓用户选择退出个性化广告后,第三方就无法获取其标识符,取而代之的是一连串毫无意义的“0字符”,关于用户的现有数据也会被移除。

谷歌于2021年末宣布加强对广告ID的隐私保护


谷歌与苹果,两种“隐私观”

从去年4月苹果的IDFA受限到今年安卓的隐私计划上线,似曾相识的历史背后,苹果与谷歌虽然有着共同的目的,但二者的“隐私观”却截然不同。

这一点,谷歌也在公布时就狠狠地“内涵”了苹果的做法:“我们意识到其他平台对广告隐私采取了不同的手段,直接禁止开发者和广告主使用现有的一些技术。我们认为,如果不能事先提供一个能够保护隐私的替代方案,那么这样的方法也许就是无效的,甚至在用户隐私和开发者业务上产生更坏的结果。”

去年4月,苹果正式将IDFA权限交于用户手中,开发者要想获取IDFA需要明确向该用户提出请求。一些广告分析公司的结果反馈,仅在美国市场就有96%用户拒绝了追踪请求。Facebook也因此“元气大伤”,几次“对战”后,苹果态度依旧态度强硬,坚持自己的原则。

从商业角度看,虽然苹果并不依赖于广告业务,但IDFA的受限确实能够让其成为最大的获益方。短期看,手握海量用户数据,足以让苹果在iOS应用上拥有绝对话语权;长期来讲,无法保证的广告效果或许也会让开发者转而选择订阅模式变现,苹果也能在其中抽成,获取可观的利润。

此外,如此严苛的措施下,苹果ATT的有效性依旧受到了业内学者的质疑。有苹果前工程师指出,研究发现ATT政策实际上并未对第三方追踪上有太多影响,即便用户选择拒绝IDFA请求,一些追踪方也能躲避掉ATT规则拿到用户数据。这意味着,ATT政策看似让用户掌握了主动权,但其实很有可能只是一种“心理安慰”的错觉。

而谷歌在这方面则要小心谨慎得多,试图采取更柔性的措施。毕竟,广告业务是谷歌收入的主要来源,因此如果以破坏整个生态为代价来维护隐私安全并不是谷歌想看到的;此外,安卓上90%以上应用都是免费的,对开发者来说,数字广告收入就是“饭碗”一般的存在。因此,为了保持整个应用生态健康稳定,谷歌势必要选择一个两全的方案,既能保证开发者的收入,又能保证用户的隐私权益,让生态内各方能够平稳过渡,避免像苹果那样带来巨大的冲击,这也就是“隐私沙盒”的初衷。

不过,在此之前“隐私沙盒”也面临着各方质疑,一些隐私保护者和广告主认为其依旧存在着指纹识别、跨语境隐私曝光等较为严重的隐私漏洞,况且目前该项技术并未全面应用,无法保证最终的成效。


针对安卓系统的“隐私沙盒”究竟有哪些升级?

去年这个时候,谷歌就公布了关于浏览器端“隐私沙盒”技术的一系列进展。前不久,谷歌也透露出了关于“隐私沙盒”的新升级。

一是Topics API,用来实现基于兴趣的广告投放,也是过去FLoC解决方案的升级。大概逻辑就是Topics工具能够基于用户一周的历史记录识别出最具代表性的一些话题,比如运动、旅行交通等。这些兴趣话题最多只能保存3周,过期话题会被自动删除。同样,话题的识别和选择等一系列过程都是在本地设备上完成,外部服务器(包括谷歌服务器)都无法干涉。

当用户访问一个网站时,Topics会在过去3周所识别出来的兴趣话题中选出3个话题分享给网站和广告商。同时,Topics也给予了用户足够的控制权和透明度,用户能够自由选择移除不希望被别人知道的兴趣话题。

如图:左边为用户能够看到的第三方cookies获取的信息,以链接的方式呈现;右边为在Topics工具中,兴趣的管理更加一目了然

谷歌还强调,Topics还会排除类似于性别、种族等敏感类别。谷歌认为,有了Topics,广告商无需再通过指纹识别等隐蔽追踪技术就能够继续投放相关广告。这似乎也是对去年质疑者的发问做出了回应。

二是SDK Runtime,是安卓“隐私沙盒”计划中的关键。类似于“防火墙”的工具,SDK Runtime主要用来阻止其他工具访问和获取用户信息及历史记录。

正常情况下,广告SDK在APP内部运行时,通常能够访问APP内的一切信息,而一些APP开发者也许并不能完全意识到这些实际访问权限的大小。通过SDK Runtime,则只能访问被明确授权的信息。比如如果应用程序 A 试图恶意读取应用程序 B 的数据,就会因没有权限而被阻止。

因此,SDK Runtime相当于为数据的采集与分享提供了一个安全的环境,并且通过明确的访问权限保证信息安全。

FLEDGE,主要用于再营销,是去年隐私沙盒计划中“TURTLEDOVE”的升级。逻辑与Topics类似,在安卓的Privacy Sandbox 内,FLEDGE能够让开发者在应用程序内基于用户交互行为来定义目标受众,并支持应用内的广告竞价,在此过程中无需再调用外部服务,拍卖在应用程序内进行,买方(成功出价)和卖方都可以通过 FLEDGE API 将拍卖结果传送至自身的服务器。

最后是Attribution Reporting,广告衡量,即在不泄露标识符的情况下告知广告表现。作用类似于苹果的SKADNetwork,主要提供粗粒度、带噪音的、无法识别用户的转化统计数据,无需再分享GAID。

“安卓上的‘隐私沙盒’是我们提高用户隐私标准的关键,”谷歌在博客中提到。技术的变革过程中,总是少不了质疑,但这正是进步的动力。不可否认的是,效果与隐私之间的博弈是全行业共同面对的挑战,也是近几年来苹果、谷歌、脸书都在极力解决的难题。每一次技术的变革都有可能打破平衡,带来突破,谷歌的解决方案或许不是最终答案,但隐私保护绝无终点可言,争议与质疑过后,相信新的平衡也将在不远处。

阅读全文>>

       韩国公平交易委员会14日宣布,因谷歌涉嫌滥用市场支配地位,决定对其处以2074亿韩元(约合1.77亿美元)罚款。

       韩国公平交易委员会当天发表声明说,谷歌阻碍三星等手机制造商生产搭载定制版安卓手机操作系统的手机,限制其竞争对手开发的操作系统进入市场,同时遏制了创新。

       声明说,谷歌在与手机制造商就应用商店许可和操作系统事先使用权签署协议时,强制要求手机制造商签署“反碎片化协议”。该协议规定,手机制造商不可直接开发安卓操作系统的定制版本,其生产的手机也不可搭载此类系统。谷歌这一行为反映了其滥用市场支配地位限制手机操作系统市场的竞争。

       韩国公平交易委员会表示,此次对谷歌开出罚单的意义在于为今后重塑手机操作系统和应用市场的竞争秩序提供了机会,将有利于更多创新设备及服务问世。

       另据媒体报道,当天,韩国《电信业务法》修正案正式生效。该法案禁止手机应用商店运营商强制要求应用开发者使用前者指定的支付系统,并允许韩国政府对应用商店运营商进行调查以保护用户权益。


阅读全文>>

此前,法国消费与竞争管理局因新闻版权纷争对谷歌公司罚款5亿欧元。法国消费与竞争管理局当时表示,谷歌公司应该为新闻机构的内容支付报酬,但它未能与法国的新闻机构就版权问题展开友好协商。

阅读全文>>
创业萤火
创业萤火
创业萤火
Copyright 2021 yinghuodd.com All rights reserved 皖ICP备2020017053号-1
安徽萤火点点信息科技有限公司 地址:安徽省合肥市政务文化新区栢悦中心2412室
违法和不良信息举报电话:0551-63844003举报邮箱: jubao@yinghuodd.com