在编程的时候,我们一定要想象一下,以后维护我们自己的代码的那个人会成为一个暴力的精神病人,并且,他还知道我们住在哪里。
MVP,对体育运动来说,是most valuable player(最有价值运动员/球员);对开发人员来说,是most valuable professional (最有价值专家);对产品开发来说,是minimum viable product (最简可行产品)。一些公司开发系统,一开始就勾画宏大的愿景,几个月甚至几年之后,产品还是没有见踪影。相反,一些公司追求最小化的可行产品,每个版本只发布一个新功能。
产品质量、功能和时间这三者里是互斥的。要质量和功能,那么时间就得延长;追求质量和时间,那么功能就要砍;赶时间和功能,那么质量必然下降。
看了很多公司的系统,就像在吃苍蝇。
大家看过少林足球,吴孟达样子和口吻:“代码,不是这样写的!”
怎么给垃圾系统擦屁股:你被扔了一坨热气腾腾的烂代码,幸运的话只有几百万行,没有注释,仅可能有的就是早已过时的文档,写这些代码的烂码农早已去逍遥快活。
公司X,第一天,下班了,累瘫,腰酸背痛。首两周都是各个部门的不同人来介绍公司、各种业务、各个系统,找了几个机会跟开发团队聊了一下,顺手看了一下他们的开发,具体就不谈了。
公司业务成功,和开发不是正相关 。很特别是那些行业系统,只要销售人员足够强,不管多烂的系统都可以大卖,所以,很多公司的销售人员收入很高。
公司E,硬度公司,公司绝大部分是硬度菊苣,部门都是硬度码农,除了我。主系统登录页,老板要放一个配合公司LOGO的动画,硬度菊苣就设计了个gif动画,彩虹波浪线不断翻滚,但页面加载很慢,整个窗口响应也很差,鼠标挪动都有问题,我一查,原来那个gif大小是全屏幕的,超过5兆。。。
公司B,客户端用OLEDB从Visual FoxPro读到DataTable,序列化到JSON,压缩,存到Azure BLOB,然后写相关记录到Azure Service Bus Queue,服务器端Service Bus接收到信息,取相关BLOB,解压,反序列化,再Bulk Copy到Azure SQL Server的临时表,再转换格式化各字段读关联表,最终到达目标表。。。蛋疼的感觉?
公司B,巴西码农,为了格式化法国人名常见的组合名(就是名字中间有-、·、空格等符号后面第一个字母要大写),他洋洋洒洒写了80多行代码,逐个字母替换,而且为了应付空格,又重复了一遍。。。。
公司B, 又优化另一报表,初步加了索引重构逻辑后,从原来超时到现在1分26秒,再分析,发现另外一个瓶颈是引用了这函数,报表先调用一个主的人名格式化函数,这函数再多次调用上述那函数,重构后,只需要6秒。
公司B,挺无语的,部门一码农,一个流量值(字节)要格式化显示成兆,他直接/(1024*1024),根本不明白那些小数就不能显示了,然后呢,还Round两位小数,问和尚借梳子啊。
公司B,数据库那块,简单地说,就是数据库规范里面的第1/2/3范式都完美地忽略了 。。。前端界面对一些字段没有做校验,所以系统跑的时候各种爆,譬如期望是数值但里面有各种诡异字符,期望是邮箱地址但是文字。。。日志那块,每个方法执行都做一下开始/结束日志,随便点几下界面,几百K的日志内容[摊手]
我发现,懒/烂码农,很喜欢复制粘贴。
公司S,部门一开发人员,擅长复制粘贴代码,原本几百行的代码,硬生生搞成1万多行。他说:“我写代码,疯起来,我自己都害怕!”某天,这个码农在看自己的代码的时候,迷茫了,看不懂了,代码逻辑流程太乱。所以,他只能打开Visio,逐步把逻辑画出来了。。。[摊手]
公司S,系统是asp.net webform + vb.net + 大量第三方重量级UI控件,前端、后台和数据库性能都很烂,根本不是SaaS,也不支持多服务器,各种各样的错误。我踌躇满志地来到公司,第一天就跟大家说:“做开发这么多年,烂代码我看惯了,所以大家放心,不管多烂的代码我都可以重构改造的”,3个月后,我歇斯底里地指着屏幕上的烂代码,狂叫道:“你们这样写代码是不人道的!!!”
公司S,系统各种问题,性能表现差强人意。其中一个表现是,越越来越慢,譬如同一个功能,所以参数一样,今天跑5秒,后天6秒,大后天7秒这样。。。最后发现还是跟我之前优化的日志有关,虽然改成异步批处理,但是日志基于文件,每个最大2M,不断翻滚,日志文件名逻辑是扫描所有文件来取下一个文件名。
公司S,一天,分析了一下数据库,一个客户7天做了150万次数据库读操作,约读取了200G数据,加上前端那些Web Form冗余HTML,实际从服务器上走出的数据是很夸张的(按我司的规模),数据库请求延迟更厉害,一个客户每次请求都要等0.2秒。
公司S,存在多个业务逻辑错误问题。客户反映数据有问题,部门的同事分析数据和代码,最后发现关键逻辑是读的配置文件,而这个配置是应该按具体客户的设置来的,但变量写成了static。
公司S,系统运行时大量日志生成,同步写入日志文件,我改成了异步。还有,每个页面加载完成,都记录一下用户的IP、加载开始时间、加载结束时间等信息,也是同步的,加上其它业务逻辑写得不行,所以很忙,我也改成了异步,定时批量写入日志。
一些公司的码农,不把警告当警告,完全无视之。
公司S,主系统,编译的时候,显示254个警告,不能再显示更多了。
公司S,下班前,每周五全员工公司例会中,一个IT部的同事问我:“Wilson,你们部门是否会把机器学习应用起来”,我心想:“你们连数据仓库都没做,所谓商业智能这只是做了些基本报表,数据量也不是很大,我以前随便处理都是几十亿起跳的,还想机器学习???” 然而,我还是老实说:“大家知道Google alphago吗?就是最近打败了最牛的围棋手的人工智能系统?”。没人回答。我继续“我们写程序,是直接解决问题。机器学习,是我们写一个逻辑,让机器其去利用现有的数据进行分析找出最优方案,这是非直接解决问题,”
数据从用户在界面输入开始生命周期,经过传输到达网站,经过处理(譬如ETL),再存到数据库,后续还可能有数据仓库二次处理等,最后数据失效被删除。这中间很多事情需要做,但,最重要的第一步,是确保用户输入是校验过的合法数据,否则进入系统后造成连锁反应,修复成本太高。
我服务过的很多公司,界面输入缺乏基本的校验,譬如长度,用户输入长一点就爆了。邮件格式也不判断,系统发送邮件的时候各种爆。
公司S,系统设计有问题,实现有问题,运作有问题。拿各种通知客户的定期报表邮件,地址完全不校验,同一个客户出现几十种的邮箱域名,譬如正确的是foo.com.au,实际出现:foo
coma.u, foo.com,foa.com.au, foo.com…..,一些明显是不合法的格式,一些是不存在的域名,等等,发送的时候也不校验[摊手]
公司X,系统各种安全漏洞,SQL注入轻而易举。
遇到过各种奇葩软件/系统设计,譬如LinkedIn Android版,经常告诉你无法发送内容,不告诉你为什么,之前打的长长内容都丢了,根本草稿等临存功能。一些银行的app,允许你增加、减少每日转账额度,但根本不告诉你要增加到多少或者减少到多少[摊手]。
公司S,现有的系统10多年前开始写的,技术陈腐,其中一个功能是根据不同客户不同产品从可自定义模板那里动态生成表单,这个功能是用的第三方的,本来不复杂,但随着业务发展,现在单纯渲染界面的代码行超过10,000。我在用angular改造,目前代码行200,可以显示了,接下来就是做一些交互[摊手] 。
公司S,Web系统性能差,有几个原因,其中一个,是HTTP压缩都没有启用,页面/资源加载都要用较长时间,我发现之后,顺手启用了[摊手]
公司K,系统的数据库设计很多奇葩的事情,就命名这块就看不下,用户标识(UserId)这个,同一个数据库里有以下各种形式:UserId、UserID、user_id、userid、iduser、USERID、id_user等,而且大部分是同一个人搞的 。
公司E,隔三差五发现公司印度菊苣们写的代码好多坑,譬如前端js肯定就不判断对象是否null,直接取属性,然后后续的代码都无法跑了。后端的代码更奇葩,直接try/catch抑制错误(catch无任何逻辑),今天发现一功能无法跑,分析后发现,数据库表字段类型是nvarchar,代码里定义是int,菊苣不解决抑制错误就完了
这么多年来,各种平台,看见过各种软件的奇葩实现。
公司Z,现在的业务系统,一个复杂的申请流程,所有数据都暂时保存到cookies,今天终于爆了,客户的一个下单JSON后超过4k,boooom!
写烂代码的人多用旧版本的语言,这样他们就能名正言顺地不用新版本的语法糖来精简代码。譬如c♯的自动属性,expression body、LINQ等,他们都不会用。更恶心的是重新发明更烂的轮子,数值TryParse、DayOfWeek等重搞,最恶心的是压制错误:一个对象几十个属性,不判断null,几十个try/catch逐个属性轮 。
公司A,数据库这块,因为某GIS产品Web服务的特点,把数据库分割为:每个客户3个数据库,然后呢。。。然后服务器就几十个数据库。。。。其实做到一个数据库是没有什么难度的。。。。可以预见以后各种血泪 。
公司A, 开发这块。。。之前弄过Windows Mobile,后来用Sharepoint(怨念!) + Silverlight(怨念!!)。。。。。加上某GIS产品+.NET插件(啊啊啊),现在在上马#WPF#(怨念!!!),然后准备招聘iOS开发人员和Android开发人员(啊啊啊啊。。。
公司A, 做的产品主要是基于GIS的产品,给服务人员提供地理任务标注/指示,然后开展工作。然后呢。。。。#没有自己写的服务器端#,#不直接存取数据库#,完全用某GIS产品提供的Web服务。。。。然后性能各种爆。。。。。。。
公司A,是典型的传统使用微软产品的企业,IT/基础设施这块都是AD/exchange server/SCCM等,最近弄了个JSP写的helpdesk系统,所有东西都往那里扔,连新产品/新项目/改进都放那里,还包括bug管理。。。
公司B, 系统是Web应用,引用了大量的第三方Web前端代码,超过2500个JavaScript、CSS文件。。。。每次发布要等好久好久。。。其实绝大部分都不需要用到,就是硬度码农买1送10地狂塞进去,而且grunt build那套也不用,打开首页的时间都够我去找菲律宾妹子了
公司B, 相比上一家公司,这公司的产品状况要好很多(尽管很多问题)。上一家公司的产品我接手之前只是基于第三方产品做扩展,完全不是自主知识产权,午饭商业化,我从头写,大半年完成,比第三方产品还好很多功能多很多。好歹现在的直接自主产权,技术较新,但坑多。
公司B, 这公司是和这行业的领先者之一合股搞的SaaS解决方案,软件+硬件结合,市场很大,不过,合股公司总部就是仓库,大家绕着会议桌开发,旁边的沙发坐了一堆五湖四海的合股公司员工吃各种风味的午饭。。。新公司的工作场所还在装修,隔壁,其实还是仓库改造。。。
公司B, 需要使用的第三方系统,其市场占有率超过50%,但用的Visual FoxPro开发。。。。。。。。因为官方没提供API,我们的玩法是直接逆向工程数据结构然后自行山寨业务逻辑玩弄数据。。。。。、、
公司B, 8个硬度码农(已经炒掉5个)做出来的web系统,后台ASP.NET MVC+nhibernate。。。每个controller都automapper create一次map。。。还直接数据CRUD。。。前端angularjs,每个controller直接http req。。。各种null ref问题。。。
公司A, 我发现了,代码的质量很差,主要原因是:大量复制粘贴、反复操作(譬如反复的获取同一个值做而不是读一次做变量)、冗余的循环、没有使用较新的语法糖(譬如lambda)而自行弄10多行代码实现一行LINQ搞定的、很多情况都没考虑大小写敏感,强行catch异常而不是判断
公司A, 入职一个半月,发现前任挖了很多很大的坑,一些短期内无法填,一些长期也无法填,怎么办?逐步填,一天填一个呗。
公司A, 开发,是典型的四无:无设计、无文档、无规范、无流程,无法无天(噢,五无了)。数据库设计乱七八糟,性能极渣,处理几百万数据的ETL也要跑几个小时,还会内存耗尽(32G)。。。。代码那个更无法吐槽。
公司A, 产品用的C#开发,Visual Studio做IDE,代码管理用的SVN,陈腐得很。产品开发还是waterfall,新版本发布用windows登录触发复制更新,无力吐槽。。。给CIO建议,改用Visual Studio Online,搭配scrum,项目管理/代码控制关联起来,这只是第一步,还有很多需要做。
公司A, 虽然不同州不同客户不同的业务需求,但绝大部分业务/逻辑是一样的,完全可以把基础部分标准化,但是呢,现在的做法是每个客户单独有3个数据库。。。每次基础功能/逻辑更新,就要更新几十个数据库。。。
公司A, 数据库的更新允许通过sharepoint修改任意记录,然后呢,没有后台逻辑封装,然后呢,一些表大量触发器,一些触发器几百行代码。。。
公司A,产品的日常数据查看/修改,除了专门的管理工具/客户端,还可以通过sharepoint来,有一个自定义的数据列表WebPart来绑定一个数据源,还有一个数据编辑WebPart,根据PK来更新数据,竟然允许直接修改任意记录。。。。。没有后台逻辑,没有存储过程。。。我靠
公司A, 系统的部分数据导出和通知是用的python脚本,质量放一边(容错、复制/粘贴等),产品环境根本就没成功跑动过,一个月多月了,没有人去排错。。。今天开会,我一下子就找到问题了,print组合输出某数据库值null。。
公司S,审查代码,发现多个地方都出现一个诡异的逻辑,文件输出的时候,定义编码是GB2312,我跟写代码的码农说:“可是,咱们不在中国啊[摊手],而且,那可是10多年前的做法啊[捂脸] 。