数据仓库。
化抽象为具体,先用起来。
What
作者认为,软件的数据分为三种:常量(不可变,也不可替换)、状态(可变可替换)和缓存(不可变,但可替换)。
PostgreSQL 数据库的配置文件postgresql.conf有270个参数,很难搞清楚该怎么设置。这个网站提供所有参数的详细解释。
SQL 谋杀之谜
一个英文的 SQL 初级教程,以游戏的方式,让你利用学到的 SQL 概念和命令来找出谋杀凶手。
SQL 中的 NULL 你真的懂了吗?(中文)
SQL 中的 NULL 到底是怎样一个概念呢?有什么要注意的吗?这篇文章就是要把它讲清楚。第 98 期英文版的中译。
在 SQL 中,NULL 表示「未知」的意思,就是「未知」,不知道,不了解,未知!(原文用词:「unknown」)
在大多数数据库中,NULL 和空字符串是有区别的。
但也有例外,比如在 Oracle 中,根本就不允许一个值是空字符串,Oracle 中所有的空字符串都会自动转换成 NULL。
不过对于其他大多数数据库来说,NULL 和空字符串是区别对待的:
空字符串也是一种值,只不过是空的而已。
NULL 是一个「未知」值。(或者说是「未知」,没有「值」的概念)
举个例子,就好像问:美国总统西奥多·罗斯福的中间名是什么?
一种回答可能是:我不知道西奥多·罗斯福的中间名是什么。(这种情况「中间名」字段就应该是 NULL)
还有一种回答可能是:西奥多·罗斯福没有中间名,他父母没给他起中间名,我知道的事实就是西奥多·罗斯福没有中间名。(这种情况「中间名」就应该为空字符串)
谨记 NULL 就是「未知」这个概念,就可以很容易处理一些使用 NULL 时可能遇到的麻烦。
SQLite vs MySQL vs PostgreSQL:关系数据库管理系统的比较(英文)
本文对标题里面三种关系型数据库进行了简要介绍,提出各自的优缺点和适用场景。
AWS 精萃介绍(英文)
AWS 是世界排名第一的云服务,本文以简单易懂的语言和图片,解释它的几个主要服务:DynamoDB、S3、EC2、ELB 等等。
MongoDB 的历史(英文)
MongoDB 是现在最流行的 NoSQL 数据库,本文详尽介绍了它的历史,以及早期的设计决定。
Why
我后来发现,甲骨文实际上没有书面计划,只有预算。我们的工作就是弄清楚拉里心里想要什么。
– 贝尼奥夫,Salesforce 创始人
关系数据库有两个优势,一个是节省存储空间,另一个是可以跟踪复杂的数据关系。
但是,现在的存储设备很便宜,反而是 CPU 的处理时间更贵。所以,我建议客户,如果不需要处理复杂的数据关系,那就避免使用关系型数据库,而使用 NoSQL 数据库。
不聘请数据科学家的七个理由(英文)
这篇文章提出大多数公司根本不需要雇佣数据科学家,前四点理由很好玩。
1 | 你没有任何数据 |
How
TablePlus
一个支持多种关系型数据库的图形界面的数据库管理工具。
互联网围棋数据库
可以搜索棋手姓名,查找棋谱,进行下载或在线打谱。
Experience
摩根士丹利分析师提出,郑州10月份的空气质量突然下降,表明iPhone 12 正在加紧生产。富士康的郑州工厂是苹果手机的主要生产地之一。
akshare
一个基于 Python 的开源金融数据接口库,目的是实现股票、期货等金融产品从数据采集、数据清洗到数据下载的工具,满足金融数据科学家、数据科学爱好者在数据获取方面的需求。
HugeGraph
百度安全团队研发的一款易用、高效、通用的开源图数据库系统, 具备完善的工具链组件,助力用户轻松构建基于图数据库之上的应用和产品。
典型应用场景包括深度关系探索、关联分析、路径搜索、特征抽取、数据聚类、社区检测、 知识图谱等。
SQL 实例教程
一个针对初学者的 SQL 简单教程,通过在网页上运行示例来学习 SQL。
新冠病例与 Excel
英国的新冠肺炎确诊病例数量,最近一天内暴增 16000 例。原因并非是这一天患病的人特别多,而是英国的病例统计报表使用了 Excel 的 xls 文件格式,导致前几天的统计遗漏了。
xls 格式的表最多只能有 65,536 行,多于该行数的数据源会被省略。操作人员将数据从 CSV 文件导入 Excel 时,没有发现多余的行被省略了,导致少统计了病例。
最简单的解决方法,就是将文件格式升级为 xlsx, 它的上限是 1,048,576 行。这件事告诉我们,如果你的数据集比较大,就不应该使用 Excel。