爆栈思想 – 如何强迫开发人员提高代码质量

劳逸结合

在微博看见有同学说花了不少时间修警告,修上瘾了,不想回家吃饭。首先,这位同学,身体健康是自己的,热爱工作也好,给老板卖命也好,也得work life balance,劳逸结合。

警告有什么不好?

首先,为什么要把警告给修了呢?一般来说,警告来自编译器,分几种情况:

  • 编译器认为有潜在错误的可能,譬如类型转换丢失数据等
  • 冗余代码,譬如多余的变量等,在C#中经常遇到的是try/catch(Exception ex),这个ex异常变量很多开发人员都不会使用,所以就成了警告。

这些警告,说白了,首先是碍眼、闹心,像我这种推崇代码质量追求性能的有代码洁癖的开发人员,我就不能容忍警告。

然而,代码洁癖不是最重要的,如果因为像long <-> int之间类型转换过程中导致数据丢失,那这种警告必须修复,因为错误到了生产环境后的修复成本会高很多。

怎么修复警告?

有同学说:把警告屏蔽掉,世界就安静了,problem solved!但是,这种掩耳盗铃的伎俩迟早会导致麻烦找上门来。

我曾经在一个公司做过,其主系统几百万行代码而已,几百个警告,修了我好久,都修好了,一段时间之后,发现又有几十个,身心俱疲。这显然是开发人员完全不理解为什么警告要修复,也不理解怎么避免警告。

在另外一家公司,2200万行代码,70万个单元/整合测试,没有一个警告,因为任何警告都被视为错误无法编译通过。当然,开发人员的平均水平高也是很重要的一个原因。

所以,要么狠下心把警告视为错误让开发人员老实修复,要么培养提高他们的素质。不过,根据我10多年的开发经验,不能相信开发人员的自律,必须两手都要抓,两手都要硬,因为你永远不知道哪天被猪队友坑了。在这点上,Visual Studio有“把警告视为错误”的选项。

Visual Studio大法好,你值得拥有!

怎样强迫开发人员提供技术水平?

在某司呆过,他们自己从头实现了一整套的分布式编译、测试系统,没错,简单来说他们实现了自己的Team City。这套重新发明的轮子有很强悍的地方,譬如几百种的非常严格、全面的代码风格、质量控制规则,你想到和没想到的都有,譬如,多一个空格都会被视为错误无法编译通过,一般新开发人员来到,会被逼疯。但是,这样下来,整个系统看起来都像是同一个开发人员写出来的。

当然,大部分公司都没有这样的资源去做这样的一套系统,但是,我们完全可以引入一些比较严格的自动化代码质量控制规则(即便通过插件)。

关于被动、主动的层次,英文里面是:passive(被动)-> responsive (反应)  -> active (主动) -> proactive (积极) -> pre-emptive

在代码质量控制上,我们也应该用各种规则防止被坑爹。

 

想知道为什么我这么多年来能掌握那么多种技术,不仅仅是广度,还有深度,达到我所说的“爆栈”吗?

在《爆栈之旅》,我根据大家都实际情况、水平、方向等规划职业路径,手把手带你做实战的项目,用最高效的办法达到你想要的高度。

爆栈之旅

是否想技术水平快速提升?是否希望快速成为公司的技术骨干?

核心价值
  • 把我这10多年来所学到的知识、总结的经验、吸取的教训分享出来
  • 针对不同的学生量身定制规划学习成长路线、1对1个人指导、代码审阅等
  • 解答各种技术问题
  • 为公司提供技术解决方案

请查看本站右边的信息联系我。

版权所有

所有文章内容版权所有,任何形式的转发/使用都必须先征得本站书面同意。本站保留一切追究的权利。

爆栈思想 – 我究竟值多少钱?

价格和价值

首先,我们需要明白,价格不一定等于价值。价格就是大家去购物看见商品上的那个标价,但是价值往往是另外一回事。

我究竟值多少钱?

我经常和那些找工作的朋友说,对薪资要求,一般有3种心态:

  • 我宁愿现在要求少一点,先把offer拿到手,进去之后再好好表现争取升职、加薪
  • 我会看市场,结合自身实际情况,合理地要求
  • 我会尽量抬高要求,譬如我现在拿10万,我会更下一家公司说我现在拿15万,这样他们为了追逐我,就一定会给15万以上

我多次提及,一个公司养一个员工,远远不止工资这么多,譬如你拿工资10万,加上各种税、年假病假、招聘费用、资源(工位摊分成等等)、培训,实际上公司要为你付出15万甚至更多,而且商家都是逐利的,公司会从你获取20万甚至更多,这意味着,你要求10万,公司会尽可能地榨取你起码20万的付出。

简单地来说,没有免费的午餐,你获得多少,付出的必须更多。

我没有跟进中国的市场,我只知道BAT等互联网公司哄抬了开发人员的身价,动辄几十万、上百万工资加一大票的期权股份。

单纯澳洲来说:

  • 人年平均收入大概是7万多(这几年的大概数字,没有跟进最新的)
  • 悉尼的开发人员(笼统地平均,忽略前端、后端、数据、爆栈的区别)
    • 初级开发人员(0 – 3年经验):5-7万
    • 中级:8-10万
    • 高级:11-13万
    • 小头目/架构师:14-16万
    • ….如此类推

 

想知道为什么我这么多年来能掌握那么多种技术,不仅仅是广度,还有深度,达到我所说的“爆栈”吗?

在《爆栈之旅》,我根据大家都实际情况、水平、方向等规划职业路径,手把手带你做实战的项目,用最高效的办法达到你想要的高度。

爆栈之旅

是否想技术水平快速提升?是否希望快速成为公司的技术骨干?

核心价值
  • 把我这10多年来所学到的知识、总结的经验、吸取的教训分享出来
  • 针对不同的学生量身定制规划学习成长路线、1对1个人指导、代码审阅等
  • 解答各种技术问题
  • 为公司提供技术解决方案

请查看本站右边的信息联系我。

版权所有

所有文章内容版权所有,任何形式的转发/使用都必须先征得本站书面同意。本站保留一切追究的权利。

大量报表的生成优化办法

前言

一个页面,加载耗时1.3分钟,分析后发现用的O/RM,我记得12306以前爆是因为用的hibernate,而且没用好。

O/RM有各种硬伤,但总是有优化办法。我改进后测试1秒。

痛点

澳大利亚很多政府/企业财年结束(6月30日)便需要进行一些年度操作,譬如给客户发送年度报告等等。

澳大利亚最大的养老金管理也不例外,需要给数百万用户发送一个流水账单(PDF文件格式),根据多年来的观察和官方的说明,一般需要等到9月底到10月初,这意味着需要起码2个月来处理。

分析

简单计算,意味着顺序处理的话,大概每秒完成一个客户,听起来不算慢。

大家会觉得,一年的流水,多则几百条记录,取出来0.4秒,生成PDF是0.5秒,发送0.1秒,那相当合理。

在这个系列操作中,单个业务的瓶颈可能是:

  • 数据获取/计算
  • PDF生成
  • Email发送

优化

最佳的优化,彻底理解业务逻辑后作出相应的改动。在没有理解业务逻辑之前,我们一般提供效率的做法可能有:

  • 分而治之:多个服务器并行操作,每个负责某个用户组,譬如如果有10台机器,那机器1可以处理10%,如此
  • 队列异步:数据获取/计算、生成PDF和Email都分开队列,异步处理,这样每一步的操作不会因为其中一部堵塞后续的操作
  • 内存操作:PDF生成无需写入磁盘再作为附件发送出去
  • 外部资源:邮件发送可以使用第三方的支持异步的服务,譬如Sendgrid,除了独特的功能之外,我们需要的是无阻塞的异步高性能操作

关于数据获取/计算,如果要做优化,可以在设计上做一些改动,譬如加入每月统计,这样到财年末的时候只需要统计过去12个月的月统计便可。而且这些流水如账本那样,只会append only,不会对现有记录进行改动,所以无需考虑重新统计。

另外,单数据库会是性能(还有安全)瓶颈,完全可以把流水/统计数据放到多节点NoSQL里面,取的时候性能优于关系型数据库。

 

当然,还有一些更高级、复杂的优化实践,有兴趣的同学们可以根据右边二维码加我的微信。

 

想知道为什么我这么多年来能掌握那么多种技术,不仅仅是广度,还有深度,达到我所说的“爆栈”吗?

在《爆栈之旅》,我根据大家都实际情况、水平、方向等规划职业路径,手把手带你做实战的项目,用最高效的办法达到你想要的高度。

爆栈之旅

是否想技术水平快速提升?是否希望快速成为公司的技术骨干?

核心价值
  • 把我这10多年来所学到的知识、总结的经验、吸取的教训分享出来
  • 针对不同的学生量身定制规划学习成长路线、1对1个人指导、代码审阅等
  • 解答各种技术问题
  • 为公司提供技术解决方案

请查看本站右边的信息联系我。

版权所有

所有文章内容版权所有,任何形式的转发/使用都必须先征得本站书面同意。本站保留一切追究的权利。

爆栈代码方案 – 如何实现快速文件比较和去重

现有方案

我们判断文件是否重复,一般是给两个需要比较的文件进行哈希,然后比较哈希值。

这个做法有个问题,就是比较慢:

  • 如果文件大小不一样,那还需要比较吗?
  • 如果文件的一部分不一样,那还需要比较吗?

新的方案

步骤如下:

  1. 把文件列表按文件大小分组,大小不一的文件会被认为不一样,尽管有可能差异只是空格或者空行(回车换行)
  2. 快速比较文件头、尾、中间的三个部分可定义的一定数量的内容,如果不一样,则会视为不是一样的文件
  3. 渐进式比较区块,任何一个区块的哈希值不一样,则文件为不一样

事实上,BT等下载引擎也是用了类似的办法。

方案特色

  • 支持并行计算,使用MapReduce方式,分而治之,加快比较速度
  • 支持保留比较结果,以备以后和别的文件比较,而且这个比较逻辑和批量比较是一致的

项目开源,地址在这里

 

爆栈之旅

是否想技术水平快速提升?是否希望快速成为公司的技术骨干?

核心价值
  • 把我这10多年来所学到的知识、总结的经验、吸取的教训分享出来
  • 针对不同的学生量身定制规划学习成长路线、1对1个人指导、代码审阅等
  • 解答各种技术问题
  • 为公司提供技术解决方案

请查看本站右边的信息联系我。

版权所有

所有文章内容版权所有,任何形式的转发/使用都必须先征得本站书面同意。本站保留一切追究的权利。

爆栈思想 – 怎么样的开发人员才是合格的?

基本要求

地铁上,一个妈妈用手遮着孩子的鞋子,为了不弄脏旁边乘客的衣服。评论者说:“这不是很基本要求的吗?”

是的,这位同学说得没错。但是,究竟做这个的是多数还是少数呢?

很多时候,我们想当然地以为,一些基本的东西,实际上我们都没有做到:

  • 譬如不随地吐痰扔垃圾
  • 譬如给老幼病残孕妇让座
  • 不在公共场合大声喧哗
  • 不要在社交媒体做没脑的喷子
  • 不要为了蝇头小利出卖自己的人性,譬如做5毛

素质与底线

很多时候,我们可以简单粗暴地归纳,上述那些人没素质。同理,很多开发人员并没有基本的素质:

  • 不管代码质量,填满工作时间便可,善于挖坑,“我离职后,哪管洪水滔天!”
  • 懒散,故意拖进度
  • 老油条,得过且过
  • 拿网上有版权等代码据为己有

更有甚者,在犯罪:

  • 大学毕业后第一份工作,一个离职员工,把硬盘格式化,还破坏分区
  • 还是第一份工作,部门经理偷公司的源代码去卖

不奢求每个开发人员都写高质量代码,但是起码的是,代码能被维护,程序跑起来不会随意崩溃,用户体验不会顿卡,等等。

父母从小教导我们,不属于自己的东西不要去贪图,这个包括各种手段,譬如偷、抢等。邀功、推塞责任等都是罪恶。

八荣八耻

  • 以踏实编码为荣 以心浮气躁为耻
  • 以详细注释为荣 以注释残缺为耻
  • 以勤于测试为荣 以懒于测试为耻
  • 以简明文档为荣 以冗余文档为耻
  • 以注重团队为荣 以孤傲自大为耻
  • 以刻苦钻研为荣 以敷衍了事为耻
  • 以善于总结为荣 以不思进取为耻
  • 以质效并进为荣 以单取其一为耻

来自这里

 

  • 以动手实践为荣,以只看不练为耻。
  • 以打印日志为荣,以出错不报为耻。
  • 以局部变量为荣,以全局变量为耻。
  • 以单元测试为荣,以手工测试为耻。
  • 以代码重用为荣,以复制粘贴为耻。
  • 以多态应用为荣,以分支判断为耻。
  • 以定义常量为荣,以魔法数字为耻。
  • 以总结思考为荣,以不求甚解为耻

来自这里

欲望与追求

合格的开发人员,应该有自我提升的想法并且付诸行动,譬如下班后去学习一下新技术,在工作中,遇到不满的代码会尝试改进。人如果没有梦想,那和咸鱼有什么区别?

懂的交流

码农不应该是那种刻板的书呆子不善于交流的形象。技能分两种,软技能和硬技能,前者如人际交流、情感控制等,后者如对某种特定技术的掌握等。

人是群体动物,软件开发是团队协作,一个人难以完成一个系统,所以基本交流技巧必须掌握。

不管产品经理如何虐你千百遍,你还是得待他们如初恋,尽管一般都有比较苦涩的结局。

 

 

想知道为什么我这么多年来能掌握那么多种技术,不仅仅是广度,还有深度,达到我所说的“爆栈”吗?

在《爆栈之旅》,我根据大家都实际情况、水平、方向等规划职业路径,手把手带你做实战的项目,用最高效的办法达到你想要的高度。

爆栈之旅

是否想技术水平快速提升?是否希望快速成为公司的技术骨干?

核心价值
  • 把我这10多年来所学到的知识、总结的经验、吸取的教训分享出来
  • 针对不同的学生量身定制规划学习成长路线、1对1个人指导、代码审阅等
  • 解答各种技术问题
  • 为公司提供技术解决方案

请查看本站右边的信息联系我。

版权所有

所有文章内容版权所有,任何形式的转发/使用都必须先征得本站书面同意。本站保留一切追究的权利。

爆栈思想 – 数据库“状态”字段如何设计

前言

之前在文章《学员问答精选 – 1 – 数据库表拆分》中提及过一个数据库的设计问题。今天,微博上的@火丁日记 说:

表里有一个 status 字段,用来表示数据的状态,比如订单的已付款,已关闭等。以前我习惯把它定义为 INT 类型,但是慢慢的,我就记不清楚 1,2,3 到底指的是什么意思了,也想过用 ENUM 类型,但是不方便扩展,最后,我觉得直接用 VARCHAR 类型算了,去它的三范式。

百家争鸣

  • 一些网友赞同使用varchar
  • 一些还是觉得应该enum
  • 一些觉得最原始的int是最好的
  • 一些觉得要用字典表

各种考量

其实,一个字段类型的考量,主要包括:

  • 准确性/精确性:必须能满足业务需求,不能丢数据,溢出等
  • 性能:一般来说,int的运算比varchar要快
  • 空间:尽可能占用最少的空间,一条记录浪费1字节,10亿记录就浪费1GB空间了
  • 辅助性:譬如方便功能上的排序、方便开发人员记忆等

如果要为开发人员着想:

  • 数据库里,表的字段可以添加描述,譬如0: Pending, 1. Paid, 2: Processing, 3: Delivered, 4: Cancelled
  • 如果不满足,那可以用char(1),26个字符足够表达各种状态了吧?不够就char(2),再不行就char(3),主要是省空间。为什么不用varchar(n)而用char(固定数值)?因为varchar(n)要运算做各种trimming,起码在SQL Server里,譬如len()就是后面空格去掉后的长度,和datalength()不一样。这个一般是单词的首字母,记起来比int舒服些。我发现一些公司就是这样做的。

如果要追求节省空间,完全可以用tinyint甚至varbinary,毕竟1个字节有8位,一般订单也就那么几个状态吧?

首先,如果用varchar,那么要考虑:

  • 你这个状态的值,是放英文还是中文?你的产品是否全球化的?
  • 如果是放英文,那你还是需要本地化。
  • 而且,既然要本地化,就没必要放完整的单词,char(1)便可,原因参考上面。

如果使用int,那么要考虑:界面文本显示,开发人员友好。

如果要考虑界面显示如排序等,一般来说,界面需要先根据条件过滤出来某种状态,但是,如果你的业务逻辑就是要同时显示多种状态的数据,这要考虑目标数据只是已经在界面的,还是在数据库的:

  • 界面:那数据库的类型还是最精简的varbinary(1),在界面对值进行解释然后根据解释出来的规则进行排序

当然,有些业务系统会使用字典表,相当于外键,如果返回结果的时候就join,这里会比case xx when 1 then ‘某状态’ 的效率要差些,而且字典表还是需要做语言本地化的。

总结

其实,不管用哪种方案,都没有完美的,还是应该具体业务需求来。

 

爆栈之旅

是否想技术水平快速提升?是否希望快速成为公司的技术骨干?

核心价值
  • 把我这10多年来所学到的知识、总结的经验、吸取的教训分享出来
  • 针对不同的学生量身定制规划学习成长路线、1对1个人指导、代码审阅等
  • 解答各种技术问题
  • 为公司提供技术解决方案

请查看本站右边的信息联系我。

版权所有

所有文章内容版权所有,任何形式的转发/使用都必须先征得本站书面同意。本站保留一切追究的权利。

爆栈思想 – 时间都去哪里了?怎么高效使用时间?

苦恼

我的一个学员问我:“我已经入职了,有点苦恼,感觉现在一天没什么时间是自己的,不过公司这边就有安排导师就是带着我,现在在慢慢地熟悉一些东西。我现在还好,没负责什么项目,所以一天还有一些时间可以自己学习一下,可是看周围的人都感觉好忙,可能就没剩什么时间了,老师,您是怎么解决这个问题的?”

存在即合理

周围的人很忙没有时间剩下来?这不是正常吗?老板给钱你来上班就是努力干活啊,哪里有所谓的”me time”。

所以一般人想学新的东西,除非公司上新项目/改造系统,否则只能自己回家慢慢学,譬如跟我学 😉

专注

工作中,多样事情同时发生,譬如你写代码的时候,刚来公司的新人张三来请教你,可能还没有回答完,隔壁老王又来找你讨论产品的修改。

我们做个小游戏:你同时把左手放胸口搓圆型,和右手拍打脑袋,有点别扭,是吧?

同理,很可惜,很少人能同时应付多个任务,毕竟,你不是多核CPU可以并行计算,你顶多可以并发处理,就是跟CPU那样不断做context switch,在不同的项目中来回切换。

但是,这个的效果其实并不好,因为思路很容易打断,而且继续做的时候要思考一下之前做到哪里,接下来怎么做。

如果是你想合理控制时间,你需要把时间集中起来,某个时间段内任何其它东西都不做,只专注一样东西,这样更容易有实际的产出,譬如每天安排:

  • 上班中,多个30分钟,都只做一样事情
  • 下班后,30分钟看看新闻
  • 下班后,30分钟研究你的领域里的新技术
  • 下班后,30分钟做一下你的个人爱好
  • 下班后,30分钟刷一下社交媒体跟进一下好友动态

站在巨人的肩膀上

经过研究后还是不懂就马上问,别浪费时间,合理搜索正确答案和利用第三方解决方案。不要钻牛角尖,掉坑里爬出来可能是几天甚至几周之后的事情。

 

想知道为什么我这么多年来能掌握那么多种技术,不仅仅是广度,还有深度,达到我所说的“爆栈”吗?

在《爆栈之旅》,我根据大家都实际情况、水平、方向等规划职业路径,手把手带你做实战的项目,用最高效的办法达到你想要的高度。

爆栈之旅

是否想技术水平快速提升?是否希望快速成为公司的技术骨干?

核心价值
  • 把我这10多年来所学到的知识、总结的经验、吸取的教训分享出来
  • 针对不同的学生量身定制规划学习成长路线、1对1个人指导、代码审阅等
  • 解答各种技术问题
  • 为公司提供技术解决方案

请查看本站右边的信息联系我。

版权所有

所有文章内容版权所有,任何形式的转发/使用都必须先征得本站书面同意。本站保留一切追究的权利。

爆栈思想 – .NET/C# 能力和使用范围

有同学质疑C#的能力和使用范围,我说,C#可以在多个平台跑,包括移动设备(通过Xamarin写iOS/Android)、嵌入式,智能设备、电视、冰箱(如三星Tizen)等。

还有同学说质疑:“说C#能写驱动吗?” 我说:“C#还可以写操作系统 ” (atomixos  和 cosmos)。然后这位同学说:“那java呢,不就更应该建议采用java了”

其实,这种争论,犹如:“飞机可以到处飞,为什么要汽车?” 般没有意义。

你要去探望在小溪的对面的邻居,你会走桥、坐船、开汽车、坐飞机还是乘宇宙飞船过去呢?拿一种技术不擅长或者不能做的事情说事,没有意思。

不同的场景用不同的技术。按照那种“那为什么建议采用xxx技术”的观点,那其它语言都没有存在的价值了,因为每种语言都有优缺点。

而且,我喜欢C#为什么就不能推荐/支持C#了?

我觉得很多技术人对.NET/C#有相当多的偏见,而且这种偏见还是刻舟求剑式的,他们不知道.NET生态开源了,不知道现在C#在多个测试中的性能比Java还好。

微软出的开源的Visual Studio Code,越来越多的在Mac/Linux上做开发的同学用这个了,最近参加几个meetup,做aws/nodejs等等,都用这个演示。

这种偏见,一部分来自对微软的不喜甚至憎恨,譬如最近微软收购了GitHub,有一些用户就马上迁移到GitLab,尽管之前GitLab丢过客户数据。

 

最近,我花了些时间,写了2万多字的《.NET前世、今生和将来》,全面讲解.NET生态圈的历史、作用和潜力,晚点发布。

 

 

 

想知道为什么我这么多年来能掌握那么多种技术,不仅仅是广度,还有深度,达到我所说的“爆栈”吗?

在《爆栈之旅》,我根据大家都实际情况、水平、方向等规划职业路径,手把手带你做实战的项目,用最高效的办法达到你想要的高度。

爆栈之旅

是否想技术水平快速提升?是否希望快速成为公司的技术骨干?

核心价值
  • 把我这10多年来所学到的知识、总结的经验、吸取的教训分享出来
  • 针对不同的学生量身定制规划学习成长路线、1对1个人指导、代码审阅等
  • 解答各种技术问题
  • 为公司提供技术解决方案

请查看本站右边的信息联系我。

版权所有

所有文章内容版权所有,任何形式的转发/使用都必须先征得本站书面同意。本站保留一切追究的权利。

爆栈思想 – 数据库技术的革新

前言

数据库是大中小型系统的基石,所有操作,最终都需要和数据打交道,一切来源自数据,一切回归数据。

传统的非关系型数据存储

XML、JSON、CSV等文件,没有关系约束。

关系型数据库系统RDBMS

传统关系型数据库系统很难横向扩展(scale-out),很多时候我们都是仔细设计怎么对数据进行分库分片,可能垂直拆分(业务给表分块),也可能是水平拆分(表按时间、地区、自增ID等切分),还可能混合拆分。

传统关系型数据库因为追求强一致性,所以一般高可用性是通过各种形式的日志备份(log backup/log shipping等)。

分布式

当单机无法支撑业务的时候,我们可能会优先考虑升级硬件(scale-up),但单机迟早有物理限制(譬如有些机器最多支持1TB的内存),这种情况下,我们会实现分布式,所谓的scale-out。

但是,根据CAP理论,一般分布式系统做不到C(强一致性),所以他们会实现2PC(Two Phase Commit,二阶段提交)。

NoSQL

NoSQL天生支持分布式、多节点、高可用性,高性能是他们的卖点,但他们一般只强调A(高可用性)和P(分区容错),而做不到或者很基础的支持C。

MongoDB

MongoDB是NoSQL界的旗帜,他们无孔不入的宣传手段让这个问题诸多的解决方案成为很多公司的首选。

坑这么多的 MongoDB 到底是怎么做起来的?其背后的公司运作得不错:在各地区搞了用户组,给组长资金支持,组长办线下活动、找“专家”开讲座/写博客违心地夸奖 MongoDB,文章在这里《MongoDB 背后的营销策略》。

NewSQL

而如MongoDB之类的NoSQL虽然天生支持scale-out,但无法解决CAP定理指出的问题: 一致性、可用性、分区容错三者不可兼得

所以NewSQL的出现尝试解决这个问题,他们的目标是拥有NoSQL的高可用性和分区容错,还拥有传统关系型数据库系统的强一致性。

CockcroachDB

CockcroachDB是相对成熟的新型分布式数据库系统,底层基于PostgreSQL,所以支持传统的SQL查询,做得相当智能,可以自动根据数据的访问频率来把热点数据推送到最近的节点。

特点:是CP非A(强一致性和分区容错),兼容PostgreSQL。

官网在这里,开源。

Fauna

Twitter一些工程师离职后搞的数据库系统,高可用性、高性能、分布式、支持最严格的ACID。这篇文章拿MongoDB 4.x支持ACID来比较,实际上MongoDB并不支持强ACID,而且只有他们收购的WiredTiger引擎才支持,而且只支持本地节点而已。

官网在这里

ActorDB

分布式数据库,特别适合作为手机App的服务器端存储,开源项目

比较

其实,大部分的观点是,NoSQL比传统关系型数据库快,这个定义必须明确一下:

  • NoSQL的存取是读写一个文本(主要是JSON/B SON格式),一般没有外键约束等检查,没有关联查询,所以简单粗暴的操作是来得快
  • 关系型数据库系统,一般的读写要做以下操作
      • 规范化:一条记录根据业务关系拆分别存储到不同的表
      • 外键约束
      • 更新索引
      • 关联表

所以你看见,关系型数据库系统,需要额外的操作,自然会“慢”。但是,说传统关系型数据库就是慢的同学,估计没有用Bulk Copy。

应用场景

你要去探望在小溪的对面的邻居,你会走桥、坐船、开汽车、坐飞机还是乘宇宙飞船过去呢?

同理,不同的场景用不同的数据库系统。

 

想知道为什么我这么多年来能掌握那么多种技术,不仅仅是广度,还有深度,达到我所说的“爆栈”吗?

在《爆栈之旅》,我根据大家都实际情况、水平、方向等规划职业路径,手把手带你做实战的项目,用最高效的办法达到你想要的高度。

爆栈之旅

是否想技术水平快速提升?是否希望快速成为公司的技术骨干?

核心价值
  • 把我这10多年来所学到的知识、总结的经验、吸取的教训分享出来
  • 针对不同的学生量身定制规划学习成长路线、1对1个人指导、代码审阅等
  • 解答各种技术问题
  • 为公司提供技术解决方案

请查看本站右边的信息联系我。

版权所有

所有文章内容版权所有,任何形式的转发/使用都必须先征得本站书面同意。本站保留一切追究的权利。