Google

民智未开:Google 靠什么赚钱?

前两天看到一个微信公众号的新闻,内容是微软时隔十多年,重新回到市值第一的位置,因为跌的少,超过了最近在大下行趋势下跌的更多的苹果和 Alphabet(Google 现在的母公司,其实就是以前大家意义上的 Google),下面不知何故扯上 Google,有人说「Google 靠广告赚钱」,然后就有脑残粉跳出来说「那些说 Google 靠广告赚钱的是把 Google 和百度混为一谈么」,以及「谷歌推动人工智能投了多少钱等等等等」,看完真的是气笑了,民智未开啊

有很多脑残粉,真的是一粉顶十黑。Google 在很多技术领域有卓越的贡献和引路作用,也提供了非常好的服务,但作为一个盈利性的公司,目前他的主要收入来源和商业模式确实就是广告。广告本身不是什么坏东西,笨狗做过几年互联网广告算法,个人理解广告的本质就是一种信息,至于这个信息是真是假,以及是否是推送给需要的场景,那是广告审核和广告效果考虑的问题。说 Google 靠广告赚钱,真不是要抹黑脑残粉心中的圣殿,而是事实如此,Google 的财报,新员工入职的培训等,都主动明确的阐述了自己的主要收入来源是广告

关于商业模式真的也挺有意思的,互联网其实就只有这几个主要收入方式:1) 广告;2) 增值服务;3) 实体售卖;4) 虚拟物品(游戏)。广告其实是绝大部分互联网企业的收入方式,包括 Google,Facebook,YouTube,微博,阿里巴巴等,这里可能出现了几个大家觉得奇怪的名字,后面会细说。增值服务拓展一下其实包括的内容挺多,包括服务订阅,比如 QQ 的会员,视频网站的付费会员,或按订阅付费的商业服务如 Office365。实体售卖比如纯粹的电商,低进高出,自己赚个差价。虚拟物品就像 QQ 秀(其实这个到底算虚拟还是算增值还有待商榷),以及各种游戏里的充值和物品

我们提到 Google 经常会觉得是人类之光的存在,但一个商业公司终究还是要活下去的,那么 Google 就是利用他的入口优势,在搜索结果里明示嵌入和当前搜索意图相关的广告信息,从而获利(AdWords),以及,把搜索结果扩展到各种其他站点的嵌入区域(AdSense),还有视频、地图等场景(YouTube)。之所以会有 Google 各种伟光正的感觉,一是 Google 的广告审核相对严格,不至于把各种虚假诈骗等信息堂而皇之的放出来,二是 Google 的广告匹配算法相对高效,确有其相关性,不至于很突兀,三是 Google 的广告展示还是相对克制,不至于一屏大部分都是广告而没有自然结果。再加上 Google 对国内市场也不占优,国人看到的广告的确少,所以道德婊们无法接受把 Google 和某些被唾骂的公司相提并论,事实上如果挂上美帝代理,搜英文结果看看更普适情况下的 Google,可能会让某些人大失所望

微博自己纯粹的广告体系不足以支撑那么大的估值,会员服务也不给力,必然会导致官方或大 V 有各种软广,比如热搜榜,比如大 V 软文带货,这也是社区无法避免的困境。Facebook 好在市场足够大,自己的相关度和效果跟踪也足够明确,所以还可以靠比较纯粹的广告体系提供营收,但一旦用户活跃度下降,市场压力下估计也难独善其身,这也是为什么现在 FB 在下行大环境下掉的比大盘多那么多,大家都有这样的担心。如果说看衰 FB 是杞人忧天,那么隔壁的 Twitter 总是个现成例子吧,看看过去的财报和数据,事实胜于雄辩

阿里对民众包装的都是个卖货的平台,除了阿里云这种企业服务,天猫收佣金,其他的大头也还是广告。阿里在 07 年的时候公开拒绝百度收录和提供搜索结果,所有的购物搜索还是从淘宝自己的入口进来,控制了入口,控制了流量分配,就决定了广告市场有多大。(事实上 07 年的事技术上挺难做到屏蔽,但公开喊话了百度也不太合适拉下面子去做这种还有点下三滥的事)

记得之前还在做广告算法时有位大神吐槽过「我们这个年代最聪明的人,不是探索未知星辰大海,而是竭尽所能让人们去点广告,真是可悲」,的确,因为互联网企业的高薪水,现在的聪明人大部分都去了这些互联网企业,很多人也确实在各种优化广告效果。对这个吐槽,反驳无能,像「只是为人们提供更匹配的信息服务」这样的理由还是苍白无力。公司和员工都还是要活下去的,金钱也不可能凭空生成,后面离开这个行业,多少也有点这个原因。现在做企业服务,就是帮人节省时间或人力,收取比他节省部分更少的服务费用,双赢,也更踏实

Jeff Dean 对 G 的架构的串讲

原始来源: http://www.tektalk.org/2011/08/09/jeff-dean-%E8%B0%B7%E6%AD%8C%EF%BC%8C%E8%BD%AF%E4%BB%B6%E7%B3%BB%E7%BB%9F%EF%BC%8C%E7%BB%8F%E9%AA%8C%E6%95%99%E8%AE%AD/

很多资料外面都有, 不过听下串讲还是不错的

slides: http://www.tektalk.org/wp-content/uploads/2011/08/101110-slides4.pdf

youtube 的视频: http://www.youtube.com/watch?v=ulBalk7Od-Q

一日愤一句, sb

哪里有那么多脑残能把个 sb 联想的那么丰富, sb 到底是啥简写知道么, 由于 sb 的 whois 挂了, 现在也没法查证了, 这里没法畅快淋漓的骂人了…

就目前某家那些对国情的了解程度以及了解国情的人的权限来看, 完全做不了那个事情

友情提示, 还有个 .ws 的顶级域名, 大家可以尽情联想, 不过貌似 熊掌.ws 被人注册了, 而且放的是只有 favicon 的目录

笨狗找工记 by snoopy

笨狗, 计科 08 级小硕, 土狗一只, 从 2009 年 8 月的某个晚上开始找工作, 一直到 2010 年 4 月结束, 小记录一下.

找工作之前就已经明确了自己工作地点只在北京, 而且是互联网相关企业, 不能是无趣的事业单位和国企, 最好是数据挖掘或数据分析方向, 所以只联系了几家. 最后总计有过联系的有六家, 按时间顺序结果依次如下
Y: 研发工程师, offer
B: 研发工程师, offer
A: 由于时间不合适, 只投了简历最后没去笔试面试
T: 被默拒
G: 投简历直接被拒
M: 研发工程师, offer

为了方便找工作, 所以 7 月份的时候离开香港奔赴北京开始在 M 的实习, 考虑主要是人可以在北京, 而且 M 的实习相对不是特别忙, 去面试会方便很多.

8 月中旬的某一个晚上, 失眠的时候想到一个商业 idea, 从失眠变成清醒, 大脑里整理清楚后第二天把这个 idea 邮件发给了原来在 B 实习时认识的一个 PM leader, 然后在 MSN 上一起就这个 idea 聊了一阵, 最后突然问我是不是今年毕业, 该找工作了吧, 要不要过来试试看? 于是就这样平平淡淡的开始了找工之旅.

第一次是去 B 面产品市场方面的职位, 和前面提到的那个 PM leader 和一个 HR 一起聊了一个小时, 当时主要纠结是 PM 薪水没 RD 高, 而且自己也希望能一直维持在技术上的进步, 最后谁也没能说服谁, 只是自己发现现在的 PM 和以前的 PM 还是不太一样了, 可以有更多偏技术的. 从会议室出来后跑去找师兄们玩, 同时去看看原来实习的老朋友们, 被 Tech leader 认出来, 瞎扯两句后说 “没事去面 PM 干嘛, 老老实实简历拿我们这边来”. 于是被转去了技术方向.

这中间 Y 公司办了个比赛, 有很多认识的人进了决赛, 然后在帮忙推荐人, 有两个朋友一起帮我内推了一把, 其中一个还在 A 工作的朋友也帮我一起内推了 A 的北京研究院. 很顺利的过去 Y 面试, 第一次面了两面, 感觉都还挺好的. 有一些简单的算法题, 不过很久没做了, 确实还是有点手生.

然后是去 B 公司面试, 连着面了三面, 都还算顺利, 遇到几个很诡异的问题, 不过在了解应用背景后恍然大悟, 再次验证工业界的需求和学术界是差挺远的. 期间有一个很囧的事情, 就是三面的时候收到 Y 公司约三面的电话. 除此之外一切顺利, 平平淡淡无风无浪.

在 Y 公司的三面依旧很平淡, 最后问了面试官很多很细节的关于公司发展的问题, 都占掉了一小半面试的时间, 最后面试官留了邮箱和手机号, 说有问题随时联系.

八月底回了次家, 回家的前一天晚上接到 B 的口头 offer, 因为老大也都是熟人, 所以大家都很直白, 说现在没到校招时间, 正式 offer 发不出, 但是这完全不是问题, 然后就是问什么时候可以过去实习. 我的想法是我想的那几家招聘还早, 而且在 M 公司的实习项目还很要一段时间才能有一个阶段性成果, 自己想做完, 于是开始拖实习时间.

九月收到 Y 公司的口头 offer, 跟 B 公司一样需要等校招时才正式发, 不过没说实习的事情.

前面提到的那个帮投 Y 公司的朋友也帮推了一把 A 公司的北京研究院, 很久没消息后, 在九月的某天发邮件过来说下周某天上午九点去朝阳区某个地方笔试加面试, 预备好一天的时间, 看了下地图觉得好远啊, 第二反应居然是那天没法睡懒觉了, 完全没考虑和笔试面试有关的任何问题, 囧. 结果过了一天还是两天重新发邮件说笔试改早上八点了, 当时就觉得无语, 平常八点我都没起床呢, 罢了罢了, 反正对 A 也没太大的兴趣, 发了封自认为还算诚恳的邮件就说不去笔试了, 祝贵公司业务蒸蒸日上招人顺利之类的.

然后是每年招聘都因为流程乱而被人骂的 T 公司, 今年算是好好的亲历了下, 先是找朋友帮推的北京研究院一直没消息, 后来听说是一直被锁在了若干其他朋友帮推的深圳某部, 不过当时也还早, 没太在意这个事情.

九月还联系了一次 G 公司, 本科时在这实习过, 只是转正的时候面挂了, 记得当时说这种面挂的记录不会保持两年的, 而且读了个研, 算是较大的进步, 可以在研究生毕业的时候继续面的, 结果联系 HR 时直接被用稍微委婉的口气说不用投了, 反正都没戏. 不甘心没法内推, 于是说我走普通的招聘流程投简历呢? 答复是依然不行… 怒了, 此处不留爷, 自有留爷处.

十月的时候再没办法找接口推迟 B 公司的实习, 而且估摸着 M 公司今年也一直没有招聘计划, 于是就从 M 离职去了 B. 期间 T 公司发短信叫去武汉笔试… 直接无视, 打电话说去武汉面试, 跟人解释说我人在北京呢, 等你们北京招聘的时候我直接过去好了. 结果等 T 北京开始的时候, 还是短信叫过去笔试… 继续无视, 过了两天终于电话叫过去面试.

估了下时间还凑合, 屁颠屁颠从 B 公司跑过去, 也就十分钟不到的路, 结果面试官还是抽了张卷子出来, 当时就无语了, 而且跟我想投的职位完全不对啊, 那个怎么看都像是客户端开发或者手机开发的, 虽然最后和面试官聊了会, 但是感觉完全不靠谱. 过了两天再去面试, 五分钟自我介绍还没完, 面试官就说你这个背景跟我们完全不对啊, 你怎么到我们这边来的? 我瀑布汗的解释说这完全是因为 T 公司的招聘流程有问题才一直把我锁在这的… 大家一起汗了下后, 联系了下研究院的师兄和 HR, 直接带着简历跑上去面研究院. 这次表现真的不好, 有一个工程问题怎么也没想出好的解决方案, 最后聊意向时说北京研究院没有对应的职位, 问是否愿意去深圳, 笨狗表示不愿意后, 两边再很友好的随便聊了下, 这边就算完了, 然后就是默拒.

此后在 B 的实习一直忙的要死, 也没有太关注找工的事情, 虽然华为中间发了若干次短信, 但是由于我自己没投, 不知道简历哪过去的, 也没理会他们. 过了没一个月公司搬家, 接着就收到了 Y 的正式 offer.

Y 的正式 offer 很有意思, 先打电话很仔细的告诉你每项是啥, 可惜我当时正在做菜, 本以为撑死也就一两分钟的, 结果说了五分钟后我无奈的把火停了, 然后等挂电话时发现已经二十分钟过去了. 然后是去公司拿纸质 offer, 三面的那个 GG (应该也是小 boss 了) 单独在一个小会议室里详细解释 offer 细节, 并就公司发展等很多方面互相沟通了下. 晚上请饭, Y 的老大和两个技术的头加一个 HR, 剩下一堆拿 offer 的一边吃一边问, 我继续很不厚道的问了几个估计比较尴尬的问题, 得到的答复还是很外交辞令风格, 虽然比起从外界获取的消息而言已经靠谱多了. 最后考虑了也没有太久, 因为短期发展和 offer 都没 B 家高, 虽然工作强度和压力没 B 高, 而且保证解决北京户口, 但是还是直接拒了.

本来以为到这里今年就算完了, 安心实习好好工作. 结果到十二月的时候 M 公司的师弟说那边新放了一批名额出来, 问我还去不, 本来想着对那边也没太多期望想说算了, 结果问了几个人, 都说干嘛不去啊, 又不掉肉. 于是简历发过去, 过了几天面试, 从上午一直面到下午, 其实也就四轮, 只是中间有间隔, 问的题其实都不难, 但是还是非常考细心的, 不知道是不是 M 的一贯风格, 因为三年前去 M 的另一个地方面实习时似乎也是这样. 一周后终面, 本来说我运气好一直没遇到英文面和特别难的技术面, 结果这次啥都碰上了, 虽然是个中国人, 然后又是被一个简单的问题卡住, 自己想的太复杂了, 囧…

M 承诺说一两个星期会给结果, 但是从十二月一直等到过年都没结果, 一开始还躁动了下的心又因为以为被默拒而平静了下去, 平静一直持续到了三月初. 三月 M 公司的 HR 打了一个电话过来给口头 offer, 然后要求第二天中午之前就确认是否接受, 因为已经很晚了, 如果不去就把名额让给后面的. 本来我都差点忘记还有这么一个地方没出结果的, 被这么一弄后又开始纠结, 纠结了半天, 找现在的经理聊了下重新把一些原来说好的事情再确认了下, 然后还是比较舍不得打电话拒掉了 M, 本来这事应该就算完了, 结果…

先是 M 的 HR 在我电话拒掉后还是说这事可以再说, 然后联系 M 那边的部门的头说安排见面聊下, 过了半小时马上又改说有空的话电话聊吧, 怕安排见面太晚了, 于是接到头儿从地球那头打过来的电话, 聊了差不多一个小时, 倒是更像我在面他, 囧… 最后还发邮件给我告诉手机号让有问题随时联系, 只能说确实感觉太不好意思了, 然后反思自己是不是太不厚道. 接着是被和 B 公司的老大们继续谈人生谈理想, 苦口婆心分析利弊. 纠结之间很邪恶的答应了 M 的 HR 说去他们的新员工拓展培训, 反正只是出去玩三天, 刚好就当给自己休假了, 也正好能从忙个不停的工作中抽出来安静的思考一下到底自己会想去哪里, 而且 M 的 HR 说了不会因为我去了这个就要我非签不可或怎样怎样, 只是因为他们分两个队, 有个队差个人而已. 于是火速跟在 B 的相关的头请好假, 头儿们很无语, 但是也没办法只好同意, 第二天偷溜出去跟着 M 的一大票人被拉去了通州郊区.

在 M 的拓展中无耻的白听了很多职业规划和发展方面的课, 也玩了很久, 和很多老朋友或者才认识的新朋友们也说过这个纠结, 最后居然一致得出我应该去 B 的结论. 原因主要还是一个短期发展, 因为毕竟我在 B 都已经有这么久的经验, 已经站在一个不错的起点, 而去了 M 则需要全部从头开始, 别的钱啊户口啥的都是小事, 差距不大. 事后想想也许一开始我心里就有倾向了, 只是自己还是有点舍不得 M, 需要找人把自己推向更确定的方向而已. 拓展回来后的第一个工作日, 满心愧疚的给 M 的 HR 写拒信… 高清屏上的小字写了一屏幕…

然后, 没有然后了, 笨狗找工经历就此结束了, 最终签约 B 公司, 研发工程师.

为什么我对谷歌退出完全没感觉 (谷歌非 Google)

首先说明, 这篇文字完全是个人看法, 里面包含了非常多的个人偏见在里面, 我无法代表任何其他人或组织, 并无法指定任何其他人或组织对此文负责, 我同时无耻的表示不对此文任何内容负责.

谷歌走了, 网络上顿时又热闹了好多, 有被扣五毛的人在兴高采烈奔走相告, 有被扣七美分的人在如丧考妣痛心疾首, 笨狗其实是有那么一点高兴的, 但是也有不少忧虑, 好不容易确定下来自己人格分裂到底是因为啥, 回头发现已被扣帽子无数. 于是笨狗觉得春天都已经来了, 这么多帽子带着还是很影响视野的, 加上帽子被扣这么多顶, 而不管是五毛还是七美分都没见到一张, 很是忿忿不平, 于是想嚎叫两句提醒下编制内的人也拉编制外的人一把.

扯淡结束, 回归主题. 先还是明确几点, 如果讨论的基础都不一样, 那讨论就只能是毫无意义的对骂, 我的出发点如下:
1. 谷歌将服务器撤出中国大陆, 转而在香港地区为中国大陆提供服务
2. 撤离的是谷歌, 即 Google.cn, 而非 Google, 即 Google.com 及其他

之所以强调 Google 不是谷歌, 是因为看起来虽然是一家, 但是这两边提供的服务还是太不一样. 就比如反对网络审查的人指出的, 谷歌有自我审查机制, 而 Google 没有, 再比如只在 .cn 上与第三方合作提供的音乐, 问答, 来吧等服务. 有自我阉割的谷歌退到了大陆以外, 似退实进, 因为现在不用自我审查了, 而且又还能提供那些 Google 全球没有的特色服务, 在某些敏感词上被盾就被盾, 反正在大陆也要被阉掉, 还不如让盾掉, 反正真心想找的人, 翻墙或遁地技术绝对都能过去.

今天看到一个分析说西方政治和中国政治的导向不一样的帖, 里面有一点提到是: 西方都是精英领导民众, 民众渴望被精英认可, 而我天朝是草根引领潮流, 领导必须对大众妥协. 我无意掺和太高深的东西, 只是从工程师的角度来看这个, 也觉得很有意思. 不管是外面的报道, 还是我自己的亲身体验, Google 都是一个工程师推动的企业, 非常多的产品或新特性, 都是由聪明绝顶的工程师们想出来再向大众推广, 大众里的精英接受后再继续推广开来, 这一点上表现最明显的就是 Gmail, 最早的邀请机制保证了参与人的质量, 并通过这些人对高阶功能的使用而让产品品质快速迭代, 然后再逐步开放给那些用什么邮箱都无所谓的普通用户. 相比之下, 大陆的那些成功产品, 比如百度贴吧, 知道, 无不是工程师们向广大网民妥协的结果, 而非工程师强势引导民众跑步前进. 回到谷歌身上, 当年李开复先生宣布谷歌这个名字之时, 就应该是考虑过在大陆的妥协性战略方向, 所以会有后来的输入法, 有天涯问答和来吧, 以及 g.cn 的域名, 265 导航, 以及我非常喜欢的谷歌音乐, 但是妥协并不能违背原则, Google 之所以经常被当作正义一方, 很重要的一个原因是其 “不作恶” 这一句话.

但是在大陆的谷歌是否能和 Google 一样, 维持 “不作恶” 呢? 关于这个问题, 我是持否定态度的. 姑且不说所谓的输入法词库抄袭事件啥的, 就看看谷歌收入, 看看有多少收入是不干净的, 有兴趣的可以去搜搜看 “新蛋”, 如果不出意外, www.360buy.com 这个网站是会出现在广告位置的, 而且默认应该是在左侧第二位, 对此笨狗表示笑而不语. 如果不出意外, 不少看客这时候会立马给我扣一顶五毛的帽子, 然后说百度那么多垃圾广告你怎么就看不见. 笨狗的观点只是: 如果你一直坚持自己是清白的, 那就应该一直清白下去, 不能因为别人一直不清白就可以让自己偶尔不清白下. 这句话说的再难听点, 就是, 立了牌坊就不要做婊子. 可惜的是, 谷歌在大陆一次又一次的突破自己的底线, 最后终于表示忍无可忍无须再忍直接跑路了, 就无须再忍跑路一事, 只要是正常人都会叫好, 但是如果扯上说忍无可忍, 笨狗就觉得比较扯淡了, 如果真的坚持原则坚持底线, 那就应该在第一次最痛的时候大叫出来, 而不是这么多次后突然觉得不爽了要抽身离开, 而且就算这时候走, 也就不用再装的跟个雏一样.

前面说不满, 后面说希望. 谷歌离开大陆, 在很多大是大非上就可以很坚定的坚持原则了, 虽然有被盾的危险, 但是比起在国内被要求自我阉割, 显然可以理直气壮的说我不作恶, 作恶的是万恶的功夫网. 这样做, 减少了自我阉割的工作量, 即让产品做的简洁高效, 又能占领道德制高点, 何乐而不为, 而且撞墙本来就是小概率事件, 我 diang 还不至于让大部分正常的请求都撞墙上的, 毕竟墙也不一定扛得住. 至于某些人担心的说以后我 diang 将 Google 全部盾掉, 个人觉得应该不会, 只要把那些不听话的盾掉就可以了, 而且 Google 又不傻, 除去我 diang 那些无理取闹的要求, 大部分事情就算我 diang 不要求, 他们自己也会做包括暴力/色情等自我审查和过滤的. 盾掉 YouTube, Twitter, Facebook 这些对普通群众影响真的不大, 我们有 youku, 新浪微博和开心/校内, 但是正如大多数人指出的, 盾掉 Google 会使得学术界和技术领域很受伤, 而国内的百度等搜索引擎完全无法提供一个端的上台面的英文或其他外语搜索服务.

最后还是扯开一下, 笨狗非常不理解那些有二分类嗜好的人的想法, 为啥每次一扯到 Google 就一定要拉上百度, 如果 Google 利益受损, 那百度一定在后面干了手脚从中得利, 如果有人反对 Google, 哪怕是一直支持, 只在某些特定事件上反对 Google, 那一定是百度的走狗. 到底是真的大脑部分受损或只是为了逞一时口快乱骂一通? 是不是这些人也被我 diang 教育的很好, 不是好人的一定就是坏人, 不是坏人的就一定是好人. 电影里共军打日军打国军, 所以共军是好人而日军国军都是坏人, 那沪松保卫战血战台儿庄的国军呢? 他们面对日军时是好人还是坏人? 生活… 真的不是一个二分类问题.

乱弹某家的分词

作为一个严肃的 IT 民工, 对于某家退出这事还是挺关注的, 最近两天比较好玩的一个是 “你妈逼”, 一个是 “美少女战士”, 外行看热闹, 内行看门道, 我们也来乱弹下这里面的门道.

早几年在某家实习的时候, 大概瞄过几眼分词结果, 由于这个内容算是比较敏感的东西, 当时也傻乎乎的对这个没兴趣, 所以没有去看具体怎么做的, 只是觉得怎么这么挫, 分词出来切的这么碎, 你说把 “山谷歌曲” 这样的切开也就算了, 但是自家公司名单独输入时也切开, 这个有点说不过去吧. 后来在搜索结果中看多了, 觉得应该不是这样的, 只是我们都在自作聪明觉得自己很牛叉, 实际上, 最后他应该还是用了很强的方法将其重新粘结起来, 所以效果和更懂中文那家比起来, 应该也是伯仲之间. 下面我们用黑盒测试来分析看看.

回到第一段那两个情况, 第一个由于是粗口, 我们就还是不分析了吧? 还是大家觉得就这种才刺激? 在这个情况里, 真实的原因绝不是因为 “妈” 和 “逼” 两个字是被过滤的而导致只搜出 “你”, 而是 “妈逼” 这个词被过滤, 不信大家分别搜 “你妈逼”, “妈逼”, “妈”, “逼”, “妈了个逼”, 可以发现只有 “妈逼” 俩字挨一起出现才会被过滤, 其他情况都不会. OK, 这里我们得到结论一, 安全搜索里提示的切词结果并不是他们家最终的切词结果, 充其量只能算是最细力度的基本词, 回头他会拼回去的, 而这个拼接功能非常强大.

一上来就拿粗口一句来做样例, 实在是有辱斯文啊, 罪过罪过. 再来看 “美少女战士”, 关于为什么 “美少女战士” 会被提示 “美” “少女” “战士” 被过滤, 而 “少女战士” 等就不会的原因, 见上一段分析, 这里我们分析另一个维度, 请大家去试试看 “美少女戰士”, 是不是什么状况都没发生? 而右上角还是提示我们安全搜索是打开的, 这可以得到结论二, 某家不做简繁转换, 简体就是简体, 繁体就是繁体, 当两种语言来对待, 而且简繁过滤词表不一样.

我刚很犯贱的想去试试看 “胡萝卜”, 结果直接就被盾了, 我真想说功夫网的中文处理能力真的有待提高啊…

OK, 等了一会, 恢复后我们继续. 来看看某家在浸淫输入法也好几年后对中文纠错的情况, 先来个简单的, “开心网”, 没错, 一切正常, 那 “开星网” 呢? 会提示我们是不是 “开心网”, 不过很奇怪, 为什么只有前面两个字飘红了? 再试了下 “开星”, 能纠成 “开心”, 看来是按纠错词来给出建议的, 只标记纠错的部分? 为了验证这一想法, 再试了下 “开心不开星” 这样的纠结查询, 果然. 但是回头当我用 “kaixin”, “kaixing”, “kaixinwang” 再实验的时候, 感觉这个又不是很确定了. 今天在某群里, 一群无聊的人在试各种各样奇怪的查询, 比如 “小泽玛利亚”, 华丽丽的被提示每个字都是屏蔽字, 有了前面分析的结论一, 我们知道这其实是因为这五个字有机结合的时候才被屏蔽的, 但是纠错呢? “小泽玛莉亚” 就丝毫没事, 也不提示我们正确的写法, 抑或这种译名某家也没有说确定哪一个才是正确的? 再试试看 “xiaozemaliya” 呢? 也还是不提示, 仔细看了下, 我用的确实还是简体中文的 .com.hk, 按理应该跟 .cn 逻辑一样啊, 也不给纠错提示, 太失望了, 难怪某家占有率一直上不去, 这种淫民大众的基本需求都满足不了. 但是 “小澤瑪利亞” 这个, 却能飘红 “玛利亚”, 这个让我表示比较理解困难, 同理, 用 “小澤玛丽亚” 会提示 “小澤玛利亚” 并标红 “玛利亚”, 而且搜出来的结果中大多也是简体 “小泽玛利亚”, 这个同样理解困难, 某家的拼接术太强了.

后记, 这些乱七八糟的分析足以见得 IT 民工们都是多么的无聊和猥琐, 连测试用例都这么的圈圈叉叉. 不过另一方面来说, 优秀的 IT 民工还是应该刨开口水战, 去分析看看真正的技术细节是怎样的, 今天发了个搜 “百度” 出 “www.google.cn/sh2009” 的广告截图发出来, 那些喷子们却又一个都不敢说话了, 果然只是一群不值一提的喷子. 截图见 http://att.newsmth.net/att.php?p.26.804632.482.jpg, 怎么弄出这个效果各位自行分析 :)

每日愤一句: 很多事并不是非对即错的 [1]

最近互联网很热闹, 帽子也很多, 鉴于某狗向来喜欢凑热闹又喜欢插嘴, 帽子更是被扣了一顶又一顶

主流的逻辑有这么一条: 反对 Google 的一定就是五毛, 一定支持 GFW 和网络审查

这个是不是有点太偷换概念了? 我喜欢 Google, 但是不爽 Google 这次的行为, 反对 GFW, 支持有限度的网络审查 (比如现在谷歌在香港的安全搜索, 屏蔽色情和暴力), 那我算啥? 到底是五毛还是七美分?

为啥这个世界上很多事情明明不是二分类的要被逼成二分类? 这又不是非对即错, 又不是试卷上的判断题, 而且就算是一个判断题, 比如是否支持谷歌退出中国大陆这一个问题上我选择支持, 那又如何? 你怎么知道我为什么支持他走?

ps. 诚心求五毛或七美分编制, 本人长期从业 IT 相关, 曾在 Google 和百度实习, 可以爆更多猛料

老罗这个…

本文转载, 原文见并不存在的 twitter.com

看着给google献花的照片感动了一会突然反应过来又火了,妈的,去年一月宣传民主和科学并且在拒绝自我审查方面远胜google的牛博网退出中国时,怎么没有人到新中关大厦献花?你们这些洋奴才,老子要在美国给牛博国际注册一个公司再杀回中国,然后再退出中国,看你们这帮孙子到时候献不献花。

阴谋论

1. 美国宣布售台爱国者导弹
2. 01/11 中国在表示抗议的同时公布了 CNMD 的实验
3. 01/12 百度因为美国域名商的问题几个小时无法正常访问, 表面上是伊朗人干的
4. 01/12 中国 “黑客” 反攻伊朗
5. 01/13 Google 宣布退出中国, 因为中国的黑客攻击以及恶劣的人权状况

我什么都不知道, 我什么也没说, 我只是阐述事实