思行合一,体验实现

律政俏佳人2这部多年前看过片子我已经记不清其中的情节了,但是这么多年来让我记在心中的是片尾Elle在国会的演讲里剪头发那个比喻。嫌头发剪的不好看?经常发生的情况是你就坐在那里,眼睁睁的看着发生的事,就让它发生了。生活工作中何尝不是常见此场景,抱怨不断,但是什么都没做,只是眼睁睁就看着它发生了,为什么不行动起来,做点什么呢?

多年后再读一遍全文,有更多的感受。

Elle Woods’ Speech:

      Thank you, congress madam.

      Hello everyone! My name is Elle Woods, and I’m here to speak to you today about a piece of legislation called Bruiser’s bill.

      But you know, today is supposed to be by education. So instead I wanna tell you about the education you all have given to me of the past 3 months. See one day, I came to Washington to help my dog Bruiser and someone along the way I’ve learned a really unexpective lesson. I know you were thinking, Who is this girl? And what could this simple small town girl from Barelare have to say to all of us? Well, I’ll tell you. It’s about something that bigger than me or any single active legislation, this is about a matter that should be of the highest importance to every America- My hair.

      You see there is a salon in Barbalyhouse, it’s really fancy and beautiful, but it’s impossible to get an appointment, I mean unless you join your robots so one of the girls is your friends or you can just forget it. But one day, they called me, they had an opening, so I was gonna finally to get a chance to sit in one of those secret beauty chairs, I was so excited. Then the colorist give me breathlessly brazen instead of hair-look honey, the shampoo girl, wash my hair with perm solution instead of color intensive moisture strengthen conditioning shampoo, finally the stylist give me a bob, with bangs. Suppose to say, I was just wrong, all wrong, for me, you know? First I was angry, and then I realize my anger was complete misrouted, I mean, this wasn’t the salon’s fault, I had sat there and witness this injustice, and I just let it happen. I didn’t get involved in the process. I forgot to use my voice. I forgot to believe in myself. But now I know better. I know that one honest voice can be louder than a crow, I know that if we lose our voice, or we let those who speak on our behalf compromise our voice, well then this country, this country is infer a really bad hair cut. So speak up America, speak up! Speak up for the home of the brave; speak up for the land has the free gifts with purchase, Speak up America, Speak up!

       And remember, you are beautiful!

      Thank you.

谢谢你们,国会的女士
各位好!我是ELLE WOODS,我今天来这里是讲述给大家被称为Bruiser’s bill的一条法规。
各位知道,今天的社会是通过教育实现的.所以我想给各位讲述过去3个月你们给我的教育.
一天,我来华盛顿帮助我的狗狗Bruiser和我学到的没有预料到的一课.
我知道你们一定正在想,这个女孩是谁呢?这个来自BARELARE小镇的女孩会对我们说什么呢?
好的,我来告诉大家,它是关于比我或是任何单一积极的法规大许多,这是有关对每个美国人都最为重要的一件事情.
你们知道在BARBALYHOUSE有一个沙龙,它是非常有魔力的,不过要预约到他们的服务是很难的,除非你加入到明星们的行列中或是你能够忘记它。
然而有一天,他们对我开放了,我最终能得到机会坐到这些秘密而漂亮的椅子上,我异常兴奋。
接下来理发师把我的头发弄成屏息状以及黄铜色的头发,而不是我头发真正的蜂蜜颜色。洗头的女孩用烫发洗液为我洗头发而不是用护发素,最后发型师给我剪了一头短发,像邦士一般可笑。
我猜想,我错了,完全错了,你们明白吗?首先我生气了,
然后我意识到我的气愤是被误导了,我明白了,这不是沙龙的错
我坐在那里,眼睁睁的看着发生的事,就让它发生了。
我没能身处其中,我忘了使用发言权,忘了自信。我知道一个诚实的声音要比咯咯笑更响亮,
我知道 如果我们丧失自己的声音,或是我们让那些代表我们发言的人使得我们的声音妥协,
那么这个国家,一定是糟糕的发型。所以 大声说 美国,大声点!为了勇敢的祖国,为了土地有购买礼物的自由,大声说 美国,大声说!
记住,你是最美丽的!
Thank you.

 

国产列式数据库GBASE 8a 集群版评测(1)

这段时间在研究大数据,对列式数据库也有一些了解,老大发了邮件说了一个国产的列式数据库GBASE,号称比oracle快10-20倍。说实话,操作系统,数据库,这样的核心技术我不认为国内有这样的实力能完全国产化自主研发,有也是基于开源技术的重新包装,有了源代码就真能掌握其中原理?而开源技术的闭源实现生命力不会持久,例如国产的linux,国产的ophone,国产office,哪个最后也没有推广开,这方面不崇洋不行。虽说有疑虑,搞技术还是要数据说话,空谈无用。

前两周GBASE销售到公司对GBASE做了交流,先对技术特点作了介绍,并讲解了一些和oracle,Greenplum,Teradata,Sybase IQ的对比测试案例,因为主题大致也和我的目前工作相关,所以老大指定我来负责公司内部的GBASE学习。GBASE看起来听起来都不错。但是做技术的都知道,没有one thing for all的解决方案,所有的解决方案都是只有在特定场景,特定规模下才是最优的。有点很好,更要知道其局限性,才能在后续项目选型中使用。

 

先简单按交流上的内容介绍下GBASE 8a

真正的列存储RDBMS体系架构。 数据加载高效:装载数据速度大于1TB/小时。

可扩展性:单个集群可达到128个节点,PB级的数据库。

压缩优势:轻量级数据压缩,数据不膨胀,启动高级压缩可以达到1:10以上的综合压缩比,压缩状态下查询性能不下降。

并发优势:读写没有互斥,MVCC的支持,边入库边查询,并发用户大于2000。 支持海量数据存储、查询。 数据分布的灵活性:基于策略的数据加载模式。

集群架构优势:偏平架构,无SPOF,无master瓶颈,高扩展性。

集群调度优势:网络带宽需求小。

并行优势:充分利用现代多核CPU资源。

易用性:不用特殊索引,调优,物化视图等。

可靠性:支持全量,增量备份/恢复。

易于维护:支持集群在线扩展。

高可用:支持数据冗余,自动故障探测和管理,自动fail over,自动同步。

高效率:智能索引对统计分析的高效率。

安全,监控能力:支持用户权限管理,提供图形化管理诊断工具。

  1. GBASE是一个列式数据库,列式数据库的优缺点我就不在说了

列式数据库的压缩会比较好做,尤其是一些唯一值比较少的,可以通过系统内部生成的代码表进行对照替换,尽管原来列中可能是一些较长的字符,通过自动代码对照,可以变成类似0,1这样的简单存储.

但是列式数据库有个普遍的问题是,只有在读取,或者更新的列数和总列数占比较低的时候才有性能优势,如果操作的列数接近于总列数,性能很可能会低于行式数据库,在后面的提问时间我也有问道这个问题,gbase这个性能的拐点大约在总列数的70%左右。就会下降到大约与oracle一致。而目前的ETL工具基本根据主键全字段更新,这个就严重影响性能。这个我下篇会做个具体的评测。

2.另外一个比较有特色的地方就是所谓的智能索引

这个图有点不太好理解,实质就是存储的时候数据每64k形成一个data cell(dc) ,这个有点像oracle的data block,然后对这个dc的常见的一些统计信息例如(max,min,count,sum,avg,null)等在加载的时候就计算好,存储下来。有了这个重要的数据,在一些简单的max,min,count,sum,avg,null操作的时候就只需要读取实现计算好的索引数据,同时还有一个很重要的作用是在读取数据的时候根据每个dc的max和min值筛选dc,可以大大减少全表扫描的IO

 

这个只能索引的ideal不错,但是后来我查资料的时候看到mysql infobright的这几张图,仔细看着是不是很眼熟??只不过这边是data pack。Gbase其实是基于mysql的,这个下篇也会具体提到。

3.集群版设计

GBASE有所谓的safegroup ,每个safegroup内至少有2台机,不能多于3台,这样就实现的所谓数据多副本存储,听着有点像那个hadoop里面的3副本存储策略。细看了这个以后其实和hadoop的多副本存储策略完全不是一回事,首先safegroup内是主备关系,只有一个节点能对外服务,浪费了机器资源,而hadoop的3个数据副本都可以直接对外提供服务。hadoop在遇到故障的时候,会自动新增副本,以将副本数保持在3份。safegroup在遇到故障的就只能靠那最多3个节点的命运了,自求多福了。

文中提到的在线扩容倒是问题不大,在线缩容这个我有点疑问,文档中说safegroup在删除的时候上面的数据全部被删除,如果是复制表问题还不大,分布式的表就有点悲催了吧,原来存在上面的数据怎么办?这个在后续的具体评测中会测试这一点。

文中的网络用的是infiniband,当时有些疑问,infiniband相对高端,而我们一般测试环境,或者生产环境也就是千兆以太网,后来问下infiniband也不是必须的,我个人觉得ppt上使用infiniband宣传的意义更大于实用。

第一部分到此结束,第二部分将介绍安装配置及使用部分,第三部分则是具体性能评测。

微博与RSS

微博对我的作用有点像以前的RSS,我可以订阅我想关注的东西,只不过以前是来源是网站,现在更多是”自媒体”。所谓自媒体却更加强大,能让人与人的思想互相联系,碰撞。

但微博字数的限制,总是不适合做一些思考和积累,而且有有点碎片化的感觉,很多好的东西,慢慢就被淹没了,而且东西放在别人平台上总有点不安全,把我的wordpress装上插件,这样就能把博客上的文章同步发到微博啦。

 

我们的核心竞争力是什么?

what makes you special?这对个人来讲是个好问题,这其实就是在问一个人的核心竞争力是什么。如果人没有核心竞争力那你总会在他嘴里听到各种抱怨,为什么不受重用,为什么晚来的都PM了,为什么薪资不如别人。

那么一个企业的核心竞争力是什么?肯定不会是某一项特殊的技术,技术是有生命周期的,也许你有一招鲜,但是一招鲜的企业肯定不会长久,他就会像moore的技术生命周期图所描述一样,自然地发展,衰落。这样的企业看的太多。市场从来不是一个耐心的等待着,就算是先入市场,就算有了巨大的市场份额,也不代表安全了,后来者会迅速突破。企业缺乏核心竞争力是个恶性循环。当几家公司一起,谁都能做的时候,到最后竞争只能是拼的是价格,关系。于是合同收入金额,人月价格走低,同时人力成本又必然按年提高,于是开始削减福利待遇,从公司内部下手,从而造成优秀人才的流失,流失后就更加缺乏核心竞争力。

最近看了很多案例,创新,主动变化,协作这是大家共有的关键词

这点上马化腾说的挺好

这一年来,我也在越来越多地思考一个问题:一个企业该以什么样的型态去构建它的组织?什么样的组织,决定了它能容忍什么样的创新灰度。

进化度,实质就是一个企业的文化、DNA、组织方式是否具有自主进化、自主生长、自我修复、自我净化的能力。我想举一个柯达的例子。很多人都知道柯达是胶片影像业的巨头,但鲜为人知的是,它也是数码相机的发明者。然而,这个掘了胶片影像业坟墓、让众多企业迅速发展壮大的发明,在柯达却被束之高阁了。

为什么?我认为是组织的僵化。在传统机械型组织里,一个“异端”的创新,很难获得足够的资源和支持,甚至会因为与组织过去的战略、优势相冲突而被排斥,因为企业追求精准、控制和可预期,很多创新难以找到生存空间。这种状况,很像生物学所讲的“绿色沙漠”——在同一时期大面积种植同一种树木,这片树林十分密集而且高矮一致,结果遮挡住所有阳光,不仅使其他下层植被无法生长,本身对灾害的抵抗力也很差。

要想改变它,唯有构建一个新的组织型态,所以我倾向于生物型组织。那些真正有活力的生态系统,外界看起来似乎是混乱和失控,其实是组织在自然生长进化,在寻找创新。那些所谓的失败和浪费,也是复杂系统进化过程中必须的生物多样性。

互联网生态的瞬息万变,通常情况下我们认为应变能力非常重要。但是实际上主动变化能力更重要。管理者、产品技术人员而不仅仅是市场人员,如果能够更早的预见问题、主动变化,就不会在市场中陷入被动。在维护根基、保持和增强核心竞争的同时,企业本身各个方面的灵活性非常关键,主动变化在一个生态型企业里面应该成为常态。这方面不仅仅是通常所讲的实时企业、2.0企业,社会化企业那么简单。互联网企业及其产品服务,如果不保持敏感的触角、灵活的身段,一样会得大企业病。腾讯在2011年之前,其实已经开始有这方面的问题。此前我们事业部BU制的做法,通过形成一个个业务纵队的做法使得不同的业务单元保持了自身一定程度的灵活性,但是现在看来还远远不够。

创意、研发其实不是创新的源头。如果一个企业已经成为生态型企业,开放协作度、进化度、冗余度、速度、需求度都比较高,创新就会从灰度空间源源不断涌出。从这个意义上讲,创新不是原因,而是结果;创新不是源头,而是产物。企业要做的,是创造生物型组织,拓展自己的灰度空间,让现实和未来的土壤、生态充满可能性、多样性。这就是灰度的生存空间。

互联网越来越像大自然,追求的不是简单的增长,而是跃迁和进化。腾讯最近的组织架构调整,就是为了保持创新的活力和灵动性,而进行的由“大”变“小”,把自己变成整个互联网大生态圈中的一个具有多样性的生物群落。

我相信每一个创业者都怀有一个成功的梦想,我与大家分享的是腾讯14年互联网实践的一点体会。它肯定是不完整的,但它同样也遵循“小步快跑”的灰度法则,需要一步一步去完善,大家可以继续发挥和探索。我希望的是,腾讯不仅是能让大家赚到钱的平台,更能成为业界一起探索未来、分享思考的平台。以后每年,但凡在创新方面能有所心得,我都会跟大家一起分享。

互联网的一个美妙之处就在于,把更多人更大范围地卷入协作。我们也可以感受到,越多人参与,网络的价值就越大,用户需求越能得到满足,每一个参与协作的组织从中获取的收益也越大。所以,适当的灰度还意味着,在聚焦于自己核心价值的同时,尽量深化和扩大社会化协作。

互联网时代不再流行单打独斗,闭门研发。共享,协作成为新的趋势,不懂得共享知识利用开源社区,回馈开源社区,只能是永远跟在最后,干着脏活累活。

以前我们说手里拿个锤子,就总觉得什么都是钉子,说的是那种不懂得情况分析差异,总想要自己最熟悉的方式去解决问题的。可是现在反过来亦成立,有个新技术出现了,大家就打算抛掉现在现有一切了,什么都想用新东西来做。但是不会如果没有学会持久创新,主动应变,就算学会了。辉煌也只会是昙花一现。