0%

DataBase

数据仓库。

化抽象为具体,先用起来。

What

三种数据类型(英文)

作者认为,软件的数据分为三种:常量(不可变,也不可替换)、状态(可变可替换)和缓存(不可变,但可替换)。

postgresql.conf 详解

PostgreSQL 数据库的配置文件postgresql.conf有270个参数,很难搞清楚该怎么设置。这个网站提供所有参数的详细解释。

SQL 谋杀之谜

一个英文的 SQL 初级教程,以游戏的方式,让你利用学到的 SQL 概念和命令来找出谋杀凶手。

SQL 中的 NULL 你真的懂了吗?(中文)

SQL 中的 NULL 到底是怎样一个概念呢?有什么要注意的吗?这篇文章就是要把它讲清楚。第 98 期英文版的中译。

在 SQL 中,NULL 表示「未知」的意思,就是「未知」,不知道,不了解,未知!(原文用词:「unknown」)

在大多数数据库中,NULL 和空字符串是有区别的。

但也有例外,比如在 Oracle 中,根本就不允许一个值是空字符串,Oracle 中所有的空字符串都会自动转换成 NULL。

不过对于其他大多数数据库来说,NULL 和空字符串是区别对待的:

空字符串也是一种值,只不过是空的而已。
NULL 是一个「未知」值。(或者说是「未知」,没有「值」的概念)
举个例子,就好像问:美国总统西奥多·罗斯福的中间名是什么?

一种回答可能是:我不知道西奥多·罗斯福的中间名是什么。(这种情况「中间名」字段就应该是 NULL)
还有一种回答可能是:西奥多·罗斯福没有中间名,他父母没给他起中间名,我知道的事实就是西奥多·罗斯福没有中间名。(这种情况「中间名」就应该为空字符串)
谨记 NULL 就是「未知」这个概念,就可以很容易处理一些使用 NULL 时可能遇到的麻烦。

SQLite vs MySQL vs PostgreSQL:关系数据库管理系统的比较(英文)

本文对标题里面三种关系型数据库进行了简要介绍,提出各自的优缺点和适用场景。

AWS 精萃介绍(英文)

AWS 是世界排名第一的云服务,本文以简单易懂的语言和图片,解释它的几个主要服务:DynamoDB、S3、EC2、ELB 等等。

MongoDB 的历史(英文)

MongoDB 是现在最流行的 NoSQL 数据库,本文详尽介绍了它的历史,以及早期的设计决定。

Why

我后来发现,甲骨文实际上没有书面计划,只有预算。我们的工作就是弄清楚拉里心里想要什么。
贝尼奥夫,Salesforce 创始人

关系数据库有两个优势,一个是节省存储空间,另一个是可以跟踪复杂的数据关系。

但是,现在的存储设备很便宜,反而是 CPU 的处理时间更贵。所以,我建议客户,如果不需要处理复杂的数据关系,那就避免使用关系型数据库,而使用 NoSQL 数据库。

不聘请数据科学家的七个理由(英文)

这篇文章提出大多数公司根本不需要雇佣数据科学家,前四点理由很好玩。

1
2
3
4
你没有任何数据
你没有正确的数据
你没有明确的问题要解决
你实际需要的是分析师

How

TablePlus

一个支持多种关系型数据库的图形界面的数据库管理工具。

互联网围棋数据库

可以搜索棋手姓名,查找棋谱,进行下载或在线打谱。

Experience


摩根士丹利分析师提出,郑州10月份的空气质量突然下降,表明iPhone 12 正在加紧生产。富士康的郑州工厂是苹果手机的主要生产地之一。

akshare

一个基于 Python 的开源金融数据接口库,目的是实现股票、期货等金融产品从数据采集、数据清洗到数据下载的工具,满足金融数据科学家、数据科学爱好者在数据获取方面的需求。

HugeGraph

百度安全团队研发的一款易用、高效、通用的开源图数据库系统, 具备完善的工具链组件,助力用户轻松构建基于图数据库之上的应用和产品。

典型应用场景包括深度关系探索、关联分析、路径搜索、特征抽取、数据聚类、社区检测、 知识图谱等。

SQL 实例教程

一个针对初学者的 SQL 简单教程,通过在网页上运行示例来学习 SQL。

新冠病例与 Excel

英国的新冠肺炎确诊病例数量,最近一天内暴增 16000 例。原因并非是这一天患病的人特别多,而是英国的病例统计报表使用了 Excel 的 xls 文件格式,导致前几天的统计遗漏了。

xls 格式的表最多只能有 65,536 行,多于该行数的数据源会被省略。操作人员将数据从 CSV 文件导入 Excel 时,没有发现多余的行被省略了,导致少统计了病例。

最简单的解决方法,就是将文件格式升级为 xlsx, 它的上限是 1,048,576 行。这件事告诉我们,如果你的数据集比较大,就不应该使用 Excel。

Reference

  1. LitePal 2.0
  2. RDF 和 SPARQL 初探:以维基数据为例
  3. 区块链的共识机制
  4. CS246:大数据挖掘
  5. 数据科学在线课程
  6. 分页查询不要使用 OFFSET 和 LIMIT 语法
  7. jsonbase

欢迎关注我的其它发布渠道