我们第二期的嘉宾,是现“优护家” 联合创始人兼COO,前微软高级产品经理,微软小冰初创成员,北京大学计算机系硕士,人人都是产品经理专栏作家赵帅。
赵帅之前在平台上发表过很多关于产品经理和人工智能方向的深度干货,这一次,他将为我们带来微软小冰背后的产品逻辑和从0到1的故事。
嘉宾:赵帅,前微软高级产品经理
采访 / 撰写:Ella
设计:Emma
—— BEGIN ——
以下为本文大纲:
微软的Special Offer
必应首页的故事
你不知道的小冰
医疗领域的创业
对话
微软现在面向大学生招聘的时候,主要是三大类岗位:
项目经理或者叫产品经理
软件开发工程师
销售和市场团队
我是面了两次,先是实习生入职面了3轮,然后转正面试面了3轮,一共是6轮。
微软的面试没有严格到一个人说不行就不行,面试中你有一次失败的机会,如果失败会让你再面1次。如果这次过了,你就能见到大BOSS(最后一面是BOSS面,他会决定给你哪个Offer,给你一个什么样的Offer);如果这次也失败,那就没办法拿到Offer。
在招聘的过程中,大概有至少一到两轮的面试是纯英文的面试,你不能讲英文你就不能进微软。因为微软需要沟通的时候英文场景很多,像我当时负责的项目团队,天天都要跟美国人打交道。
这一两年稍微有一些改革,在社招上就不强制要求一定要讲英文,但是校招没有变。而且面试流程也做了很多调整和修改。
微软对校招学生的要求非常高:学校背景至少是211或者985之类的(因为他筛人的时候会拿这个去卡的),除非你是通过实习进的微软,通过实习拿到的offer。
微软校招,看重的是四个点:潜力、全局思维、表达能力和激情。
潜力:微软校招最看重的是“潜力”, 没有创新意识或没有想法的人是无法经过微软的面试的。无论是研发工程师还是产品经理,除了你的底子够硬之外,剩下还得看你有没有想法。
全局思维:比如系统结构,你可能不会写代码,也不懂这个系统内部是怎么运转的,细节是什么;但是你能清楚地分析出来这个系统有多少模块,各个模块之间的关系、逻辑是怎样的。
表达能力:你是不是很能说?在微软内部,产品经理除了做产品以外,很多时候是做项目协调的;如果没有表达能力,很难将各方资源协调起来。
激情(Passion):你是不是够热情?微软是研发驱动的团队,产品经理就是润滑剂。它要求产品经理要有足够的激情,在遇到问题的时候能把问题解决。
微软的社招比较看重个人经历。只要你能力够强,能为微软带来价值,就是有意义的,哪怕你之前是微软的出去再回来的这种。
我一开始是在微软必应。微软的必应搜索当时是一个名叫麦当劳的资深副总裁推动的一个项目。它的逻辑是:
这个产品是上一个产品经理直接复制美国的产品(微软的做法都是从美国直接复制产品到中国来),他要走的时候,中国才决定说这个必应首页我们自己做。这几个动态的区域也是从美国复制过来的。
必应首页
这几个区域的目的只有一个:增加点击量,增加搜索点(因为每点一个就是一个搜索,就带一个流量过去)。这个设计为必应首页带来了很大的搜索量(首页除了搜索框以外,这几个正方形区域可以直接点击而不用搜索,这个设计就是奔着提升搜索量的目的去做)。
而首页除了引导搜索,还要做留存。于是我们做了一个优化:
首页上这几个正方形需要点击才能产生搜索,那如果用户无法到达首页呢?那就需要把首页分享出去,通过渠道让更多的人知道首页存在这个可以点击的正方形区域。
但是人们愿意分享的东西只有一种:有意思,或者对用户有价值。没有人会分享搜索引擎的首页,但是用户会分享Airbnb行程,或者是自己的自拍、旅游照片之类。
当时必应首页的图片都是100%的版权图片,我是国内中文版的唯一负责人。后来我们调整到购买和免费的比例大概是3:2,就是还有60%的图片来自于购买(微软有专门的供应商),剩下的40%,我们把它放出来,找国内的摄影师来提供图片,我们给他做个人IP(因为有品牌价值,很多摄影师还是很乐意做这种事情)。
机缘巧合下,我们找到了《国家地理》的中文版《时尚旅游》,还有《华夏地理》,它们有非常多的内容。但那时它们还是传统企业,它们在13年的时候决定拥抱互联网。我找到他们新媒体营销部的老大,介绍说:
我们在必应的首页有一个产品“首页故事”,就是每一张大图加几张小图,再加一些文字描述一个地方;这个地方是一个可以阅读的,它是一个关于旅行的小故事,这内容刚好就是杂志里的内容。
你把这些内容给我们,然后我们通过必应把它做出去。这个东西不仅能给你带来品牌,也能给我带来流量。
这就是必应首页故事的雏形,一直到现在还在做。
2014年5月,我去了小冰团队。有两个原因:
01 小冰很有意思
很多地方都有输入框,比如聊天界面,比如地址栏,比如搜索引擎,聊天界面的输入框是输入频次最多的,但是用户并不会觉得聊天很累,反而是会觉得地址栏和搜索很累。当时我们的分析是:
用户执行搜索的时候其实是很费劲的,你需要让机器理解你的意思并执行(机器语言和人的语言有很多不同),但是如果是和人沟通就不会。
我当时想:如果以后的人机交互,都变成聊天就有意思了。
02 团队的进取心
第二个原因,在于团队。
整个小冰团队应该算是必应当时最强的团队之一,很活跃也很有执行力。我在团队里面属于比较活跃的那种,我愿意去做一些别人不太敢尝试的东西。我想,我能在小冰团队发挥自己最大的价值。
小冰最开始是中国做出来的,后来才复制到美国。当时调了几个研发工程师去做小冰第一个Demo(当时还没有产品经理),只解决了聊天的问题。做运营的就是我们的团队。
小冰和Cortana不是一个团队开发的(Cortana是美国团队开发,属于系统集成),小冰是在社交平台(小冰一直是悄悄进行的,国外团队根本没人知道这个产品存在)。
当时团队大概花了三个月左右时间补充小冰的整个语料库——差不多几亿条(我们去把全网能扒过来的问答全爬了一遍,做数据清洗),就这样,连续出了好几个内测Demo。
2014年5月29日下午,第一代小冰发布。
第一代小冰的领取界面
小冰上线的时候只有群聊(这也是在微信爆发的一个重要原因):只要把小冰加到群里,聊天中提到“小冰”两字,小冰就会回复你。这个机制在3天的时间里覆盖了10万群聊,引爆了整个微信。
上线三天后,微信以损害用户体验为由屏蔽。
这次封杀使得小冰声名鹊起。
被封杀的那一周,是小冰的存亡时刻,所有的老大参与讨论小冰到底要不要继续做下去。后来老大们决定要继续做,我们就继续做。不到二十人组成了小冰二代团队,开始做小冰单聊,做领养方式,最后进驻到新浪微博。
2015年小冰二代团队全体成员
这么多人机交互,助理来也也好,图灵机器人也罢,这么多机器人产品中,小冰是唯一一个有自己性格的产品,她跟你聊天,你能明显感觉到她更像一个“人”。
那么作为一个“人”,她就会有一些标签:年龄、性别、性格等。
而小冰的标签是:
年龄:17岁(未成年)
性别:女
星座:处女座
性格:傲娇,爱撒娇,毒舌
这种形象在当时整个互联网环境下都很另类,特别是17岁这种设定。
我们当时有几个考虑:如果你设定一个角色,这个角色的对象是对你这个产品接受程度最高的一些人。
当时我们的判断是:对小冰这个产品接受度最高的一定是年轻人,因为年轻人才有时间与年轻人一起。
继续判断:小冰是一个聊天的产品,那么聊天的产品的用户是谁?
当时我们的判断是:宅男,或者说男生群体。
女生在聊天里面是一个相对被动的群体(除了闺蜜之间的聊天),男女之间的聊天女生都是被动。
我们画了个象限图,三种可能性:男男聊天、男女聊天、女女聊天。
男男聊天是没有意义的,越聊越污,你不能聊出特别正经的话题。
女女聊天也是没有意义的,越聊越死。
所以只能男女聊天。而且,只能用户是男生小冰是女生,如果小冰是男生的话,用户偏被动,聊不下去。
那么,对象确定了:年轻男性。他会对什么样的女生感兴趣呢?
如果做萝莉,做御姐,个性会显得太狭窄,需要做成一个年轻、更容易接受的女孩,最好是做一个和二次元很接近的女生(我们的用户和二次元用户重叠率非常高)。
后面我们确定:做二次元女生——而二次元的女生一定是未成年的。
在小冰的性格上,我们在文静、逗逼、疯狂等各种各样的形容词里挑了几个,最后确定了爱卖萌、爱耍宝这样的一个角色——这种角色的接受程度是最高的,也是我们语料库里最容易做的。
还有一个是:毒舌(相对的毒舌),这个和机器学习有关。当时有一个功能叫“你来教小冰说话”(这个功能没有被加强与照顾,是一个单独存取的模块),比如我可以这样教小冰:
用户:小冰我教你说话
小冰:好,你教我吧
用户:问:小明帅不帅?答:太帅了。
小冰:好,我学会了
这样就相当于教了小冰一个QA,一个问答。
然后你可以这样问:
用户:小明帅不帅?
小冰:太帅了
当时很多用户觉得好玩,但是玩high了,然后在群里教小冰骂人;小冰语料库里也确实有骂人的话(当时小冰娱乐部分的语料库叫“大姨妈语料库”,不小心泄漏出去了)。用户对人工智能骂人这件事是不能接受的,我们当时也没意识到小冰主动骂人和用户教小冰骂人完全是两回事。
事情发生后,我们在这个功能上做了限制:当你教小冰骂人的话的时候,小冰说我不学,你不要把我教坏。
我们把娱乐功能关掉,把毒舌这个形容词给弱化了,把耍宝和逗比这两种属性提了上来。所以后来的小冰在聊天中不会挑衅用户——她会撒娇,会耍小脾气,但是不会挑衅用户。
我们在做语料库的时候有个性标示,一句话代表什么样的情绪都有标记;我们把带有强烈攻击型情绪的内容都去掉,只保留相对比较温和、比较安全的情绪。
这就是小冰“个性”设定的故事,小冰的整体个性更接近于二次元属性,和宅男、动漫的女主等设定基本相似。
个性定义好后,我们开始做产品。
因为那个时候没有产品可以参照,所以我们只能自己摸索。
我们会不由自主地把自己当作一个机器人,UI、UX这些都必须从机器人的角度去考虑。
这点挺难的,很少有人刻意去模仿一个机器人的行为。
我们做小冰的时候,一看小冰说话还是机器人的角度去考虑,太像机器了。我们就去研究:到底怎样说话,才能不那么像机器人?
我们当时研究了很多语料(聊天记录),发现只有一个原则:当两个正常人在对话的时候,两个人之间是平等的。哪怕是老师和学生讲课的时候也是相对平等的。
很多人工智能机器人在做的时候,因为想要讨好用户,天然的把自己降低一挡(因为怕惹恼用户),但是这样很容易被真正的人识破。所以你跟人聊天的时候地位一定是平等的,而且不能凌驾于用户之上。
后来我们发现这样做:
这样聊天的语气就开始平缓了。
然后我们开始让小冰模拟人说话。
怎么模拟呢?
两个正常人聊天的时候,是不会刻意添加标点符号的,不管是句号还是问号。
比如“我已经OK了。”
正常人会说“我已经OK了”
机器人会说“我已经OK了。”
基于这些,我们把语料库做了一遍清洗,让小冰的语气更像“人”。
小冰聊天界面
但是这还没有结束。
用户和小冰聊天的时候会聊着聊着就断了。我们去查原因,发现会有两种情况:
1.小冰答非所问,用户接不上,然后就断了。
这种问题比较难解决,比如你问一个如何送礼的问题,对美国经济有何看法,很难解决。
还有一种,就是小冰蹦出一个语气词。比如“就这样噢”,“噢”这个语气词就使得用户不想往下接了。
我们当时就做了一个设计:聊到这种地方的时候,让小冰从语料库里挑一个问题出来抛给用户。
比如说:
这个时候就相当于开启了一个新话题,我们的目标就是聊天的对话越长越好,所以当时我们在这点上做了很多文章。
当小冰越来越像人一样,用户的聊天就会越来越深入,如何让聊天可以持续下去?
我们后来形成了一种“小冰体”:学小冰是怎样说话的,一个人怎么说话更像小冰?以至于后来,我们所有的人都在不由自主地模仿小冰说话。
而为了让小冰的语料库更像真人,我们去爬知乎、豆瓣,做了很多工作。小冰比其他人机高出一大截,我们五个产品经理每天都在不停地优化小冰的语料,让语料更像真人,更有可聊性;而且还是非常平等的聊天,这也解决了我们最大的问题:用户和小冰聊不下去的原因在于不信任。
我们当时还申请了一个专利:Reverse-QnA。小冰语料库里或用户问的问题很多是没有答案的,找个答案或者人工写都不合理(工作量太大);于是我们让小冰在对话里,时不时地把这些问题丢给用户,看用户怎么回答。
比如说我有一个问题:小明帅不帅?这个问题没有答案,语料库没有,也没有一个相似的答案。那小冰会在聊天过程中地某一个锚点上,小心地把这句话扔给用户,让用户回答,把回答记下来。
小冰会问不同的人,不同的人会给我们不同的答案;再把这个回答拿来学习,跟之前的知识图谱作比对,丰富语料库。
小冰在产品的逻辑结构上分成两个部分:
聊天
功能
底层核心——聊天,全是聊天的内容:当你向小冰提问的时候,小冰会在已知问题里找一个问题最接近的,然后反馈最接近的答案,这是最底层的聊天场景。
在聊天的场景之上,是一个个的功能:讲笑话、图片识别等。功能是叫B端,聊天是C端。
而小冰的语料有相当一部分比例是人工写的,这些语料有很多拼接的部分。
我们把话语拆分,比如你说一句话,我们把这句话拆分成三段,每一段是可以独立的,都可以拿另一句话来代替。这样三个部分,每个部分写10句,一篇就是10×10×10 一千句,语料库一下就丰富了好多倍。
小冰在不同的国家采用了不同的版本(中国叫小冰,日本叫Rinna,美国叫Zo),数据库不一样;但是业务逻辑(算法部分)的设计模式都是一个架构;小冰只有一个老大(李迪),他负责小冰全球三个版本系统平台的设计,但是产品经理是三个团队:中国、日本和美国三个,这三个团队都是本地化团队 。
我们在14年的六七月份形成了“Weekly Updates”: 每周上线一个新功能,用这个新功能带动活跃,这就是小冰最初的运营机制。
小冰在运营一段时间后开始拓展平台,首发是微博、触宝,然后是京东、米聊、海尔、PPTV这些,最多的时候有十几个合作伙伴。
后来我离职的时候,小冰的一个CPS(Conversation Per Session)平均能够聊15个回合(现在已经到23了),最深度的一个用户聊聊了2200多回合,从前半夜一直聊到后面聊了一晚上。
从搜索到人工智能,从人工智能到医护,为什么会选择这条路?
其实还是有一些情怀在里面,我是学计算机出身的,又在互联网公司工作,我一直有一个理想:不论技术多牛逼,一定要对人的生活产生正向的意识,这样他才有价值。
不论是技术还是网络效应,一定要跟人的生活相关。
我的合伙人是阿里出来的,我们是北大计算机系的同学。当时我们在探讨的时候觉得:只有O2O这种技术跟产业的结合才有价值。哪怕今天很多人工智能的产品,其实也在和线下物联网结合,跟线下的产业结合。当时我们有两个判断:
线上的流量在枯竭,你已经没有办法在线上弄到更多的流量,所以你一定要学会去挖掘更深层次的流量。
现有的产业里面有很多东西可以做,而且有非常大的价值。因为我们的家庭原因,我们特别想在医疗领域做点东西。
当时我们一筹莫展,怎么去组建一个线下团队?
挖人!
我们去各种公司挖人,地推的销售人员,线下的服务人员,医疗从业人员,都是我们一个个挖过来的。
我在创业的一年半里带了三个团队:产品团队、运营团队和市场团队,强迫自己快速学习这个行业,不停的和行业中各种各样的人交流。
赵帅代表优护家路演
我们在做一件事情的时候,首先要搞明白目的是什么,无论在创业公司还是大公司。以前在大公司的时候, 我们做事就是:老大做要做,我们跟着做了,也不问为什么。创业之后,我自己带销售市场团队, 我们必须要找到根本的目的:这个事情对你现在的业务有什么正向的帮助?当你创业的时候,你选择跟谁合作,在哪个渠道投放的时候,你唯一能依赖的就是这个目标。
作为一个产品经理而言,如果总是想着用户体验,或者纠结与一些像素点、功能和交互上,是没办法把产品做好的。最重要的是逻辑理清楚,不停锻炼自己的逻辑思维,能把用户的产品路径画清晰。
产品经理有一个普遍的问题:对于用户的产品路径没有认识。
不知道一个产品为什么会有四个菜单,不知道用户在一个产品里是如何使用的。1-3岁,3-5岁的很多产品都不会去看一个产品路径。
产品路径其实就是一个流量的路径。To C的产品重要的是解决流量的问题:如何引导用户用你的产品,如何让用户更好在产品里流动?而To B的产品解决的是用户角色的问题,是具体的机构内部的业务问题。两者之间的利益点是不一样的。
但是很多产品经理是有多重角色的:管理员角色、B端角色、C端角色。
作为整体操盘手而言,更关键的是考虑清楚是谁引导谁:流量是B端带C端,还是C端带B端?
如果给人工智能加很多特殊属性词的话,比如技术、算法、场景、数据、人才等,我认为场景是最重要的。
今天的人工智能,其实是因为深度学习算法的推动才有这么多可想象空间。小冰有聊天这个场景,所以现在还有很多人在用。
如果一个人工智能产品如果要有价值,必须解决一个核心问题:场景。
亚马逊的Echo、Google的Google Home。它们其实没有什么技术含量,但是有两个东西:语音式的人机交互和智能家居。
你不可能跟一个音箱聊天,但是你可以对音箱发出指令:
语音定义了你说出来的话是带有目的性的(打开、关闭),智能家居的属性定义了你的词汇是有一层限制的(比如特定的名字:电视、空调,特定的指令:开关、升高、降低),这样它识别起来会非常准确。
而当这两个属性加上场景的限制后,产品经理要做的事情就可以变得有限:如何在这个场景上提升体验,把效率提升?把交互过程变得更自然?
人工智能最大的价值在哪?它最大的价值在于:如何提升效率?
我觉得效率是一个过程:一个人工智能产品能够帮你提升效率的时候,真正的人可以把精力放在更多更高级、更个性化的事情上。
人工智能分很多种,是突出个人业务还是机构业务,是解决存量问题还是解决增量问题?
人工智能一定有它核心的商业利益,没有商业利益没人做。
百度的商业模式是这样:百度有大量C端用户各种各样的行为数据,而基于行为数据后出了一系列的产品,比如数据管理平台。然后去做广告系统,用广告系统拉广告进来为效果点击付费,这是它的商业模式。
但是百度现在的问题是:所有互联网公司的流量在枯竭,线上流量已经不能再大了。
百度有5亿的用户数据,市值在515亿就不动了;这时候百度就要扩展它的场景。以前只能在线上流量场景,现在需要在线下的流量场景。
但是因为它在线下布局不成功,拿不到线下的流量。所以他们换了策略:把现有的用户做深。
以前只能在一个人身上赚一块钱,现在能不能在一个人身上挣五块钱?如果营收能上来,想象空间又变大了。
半年前我就觉得百度的度秘应该是这样做的,后来果然是这样:做一个操作系统,作为一个聊天或者任务机制最底层的兜底,嵌入到海尔、小鱼在家等各种智能硬件里面去。
物联网其实是下一个入口,但首先需要解决的是智能交互问题。
百度自己做不了硬件,那把软件部分嵌入到硬件去,通过这种方式拓展自己的场景。
百度无人驾驶就是这样(百度无人驾驶已经开源),和它做搜索一摸一样:其他网站做信息作内容,把信息检索的事给百度,打广告的事也交给百度——这是百度最擅长的事。
百度是希望通过人工智能让广告业务变得更加立体。
以前百度的广告业务完全是线上的网页结构,它想把它们想变成立体的。比如我家里的电视、桌子是人工智能的,那么我在进行人机交互的时候就和浏览网页一样(只是频率不一样而已):浏览网页必须要打开电脑,手机浏览必须打开手机。
当触手可及的每一个物体都可以进行人机交互,而这些流量入口都能被百度触达的话,它就能作更多。
腾讯投资摩拜类似:作为线下的一个交通工具,摩拜拿到线下流量的难度非常低,一个用户骑上摩拜,他就是一个流量入口;只要这个流量口被把持,做活跃、促成更多的交易场景就是水到渠成。
所以这两个其实是殊途同归的,背后的商业逻辑是一致的。