BOOK 十一月 12, 2023

《机器学习实战》书摘

文章字数 31k 阅读约需 28 mins.

1.2 为什么使用机器学习

使用机器学习方法挖掘大量数据来帮助发现不太明显的规律。这称作数据挖掘。

1.4 机器学习系统的类型

根据训练期间接受的监督数量和监督类型,可以将机器学习系统分为以下四个主...

查看全文

BOOK 十一月 12, 2023

《机器学习实战》书摘

文章字数 31k 阅读约需 28 mins.

1.2 为什么使用机器学习

使用机器学习方法挖掘大量数据来帮助发现不太明显的规律。这称作数据挖掘。

1.4 机器学习系统的类型

根据训练期间接受的监督数量和监督类型,可以将机器学习系统分为以下四个主要类别:有监督学习、无监督学习、半监督学习和强化学习。

在机器学习里,属性是一种数据类型(例如“里程”),而特征取决于上下文,可能有多个含义,但是通常状况下,特征意味着一个属性加上其值(例如,“里程=15 000”)。尽管如此,许多人还是在使用属性和特征这两个名词时不做区分。

降维的目的是在...

查看全文

BOOK 八月 20, 2023

《Python 神经网络编程》书摘

文章字数 12k 阅读约需 11 mins.

更多又去的问题是没有一个简单的数学公式将输出和输入关联起来的。这就是我们需要诸如神经网络这样相对成熟而复杂的方法的原因。

关键点

  • 当我哦们不能精确知道一些事情如何运作时,我们可以尝试使用模型来估计其运作方式,在模型中,包括了我们可以调整的参数。
  • 改进这些模型的一种好方法是,基于模型和已知真实示例之间的比较,得到模型偏移的误差值,调整参数。

关键点

  • 使用朴素的调整方法会出现一个问题,即改进后的模型只与最后一次训练样本最匹配,“有效地”忽略了所有以前的训练样本。解决这个问题的一种好方法是...
查看全文

BOOK 七月 09, 2023

《自然语言处理实战》书摘

文章字数 28k 阅读约需 25 mins.

自然语言通常所指的不仅是文本数据,还包括语音和声音数据。

1.1.1 热门应用

自然语言生成的一个流行的商业应用是“数据到文本”的软件系统,它生成数据库和数据集的文本摘要。

自然语言处理的一个主要挑战是从非结构化或半结构化的文档集合中创建结构化的数据。例如,命名实体识别软件能够从主流新闻等长篇文本中提取任务、组织、地点、日期和货币。信息提取还包括关系提取,如果实体之间存在关系,则提取相应的关系。

1.2.1 定义自然语言处理任务

分词、词性标注、依存句法分析、组块、词形还原和词干提取是...

查看全文

BOOK 六月 04, 2023

《领导力》书摘

文章字数 26k 阅读约需 23 mins.

领导者应该干什么?怎样干才能事业成功?才能在组织中成就卓越? … 任何一个普普通通的人,只要养成以身作则、共启愿景、挑战现状、使众人行和激励人心这五种习惯行为,成为卓越领导者将是大概率时间,形成的卓越领导力将是真实可信的。

毛泽东认为领导工作千头万绪,但只有两件大事,一是出主意,二是用干部。换言之,决策行为和用人行为就是卓越领导不可或缺的两大行为。决策行为就是要共启愿景、挑战现状;用人行为则要以身作则、使众人行和激励人心。

具备诚实的、有前瞻性、有胜任力的和能激发人的这四种品质的人容易...

查看全文

BOOK 五月 21, 2023

《A Survey of Large Language Models》论文 v4 中文版摘抄

文章字数 17k 阅读约需 16 mins.

有趣的是,当参数规模超过一定水平时,这些规模扩大的语言模型的性能不仅得到了显著提升,而且还表现出一些小规模语言模型(如 BERT)所不具备的特殊能力(如上下文学习)。

语言建模是提高机器语言智能的主要方法之一

可以分为四个主要发展阶段

  1. 统计语言模型(SLM)
  2. 神经语言模型(NLM)
  3. 预训练语言模型(PLM)
  4. 大语言模型(LLM)

本综述从四个主要方面对 LLM 的最近进展进行文献综述,包括预训练(如何预训练出一个有能力的 LLM)、适应微调(如何从有效性和安全性两个角度有效地微...

查看全文

BOOK 五月 07, 2023

《增长结构》书摘

文章字数 8.8k 阅读约需 8 mins.

豆瓣评分:8.5

优秀的公司赚取利润,伟大的公司赢得人心。亚马逊的创始人杰夫·贝佐斯甚至提出:“不要关心你的竞争对手,他们又不给你钱。”企业应该把关注点放在用户身上,洞察他们的需求,跟他们建立紧密连接——包括情感连接,成为他们心中的“不二之选”。这些忠诚用户才是企业的基石。

业务结构

  • 撤退线+成长底线+增长线+爆发线+天际线
  • 防守线:护城河+客户资产+控制战略咽喉
  • 客户资产:客户池+会员
  • 爆发线:风口+创新+快+社交疯传

客户结构

  • 客户需求+客户组合+客户资产
  • 客户需求:欲望+...
查看全文

BOOK 四月 22, 2023

《GraphQL in Action》书摘

文章字数 23k 阅读约需 21 mins.

1.1.2 GraphQL is a specification

GraphQL operations

Queries represent READ operations. Mutations represent WRITE-then-READ opera- tions. You can think of mutations as queries that have side effects.

In addition to queries and mutations, GraphQL also supports...

查看全文

BOOK 三月 12, 2023

《定位》书摘

文章字数 20k 阅读约需 18 mins.

  • 从营销和战略的角度,我们把美国企业主流的经营哲学称为A(America)模式,把日本企业主流经营哲学称为J(Japan)模式。总体而言,A模式最为显著的特点就是聚焦,狭窄而深入;J模式则宽泛而浅显。
  • “第一胜过更好”是迄今为止最有威力的定位观念。
  • 动物学家用“印刻现象”来描述新生动物第一次见到生母时的情景。仅需几秒钟,幼小的动物就能永远记住母亲的形象。
  • 假如你想在爱情或者商业上取得成功,就必须认识到第一个进入心智的重要性。
  • 成为小池塘里的大鱼(然后扩大池塘)总好过成为大池塘里的小鱼。
  • ...
查看全文

BOOK 一月 15, 2023

《大教堂与集市》书摘

文章字数 7.1k 阅读约需 6 mins.

豆瓣评分 8.4:https://book.douban.com/subject/25881855/

  • Eric在本书中向大家展示了两种最为经典且截然不同的模式:大教堂模式和集市模式。传统大型软件公司的开发模式就像是艰难而缓慢的大教堂建造工程,它有着严密的管理和封闭的集中式结构,但在创新上、生产力上和Bug控制上却落后于集市模式。集市模式是一种并行的、对等的扁平化开发结构,其参与者大多来自于互联网上的志愿者,结构松散,来去自由,就像是一个乱糟糟的集市,但就是这 样的组织形式,却取得了像Linux...
查看全文

BOOK 一月 01, 2023

《Linux in Action》书摘

文章字数 43k 阅读约需 39 mins.

1.2.1 The Linux file system

  • UNIX Filesystem Hierarchy Standard (FHS)
  • Figure 1.2 Common top-level directories as defined by the UNIX FHS

1.2.3 Getting things done: Linux file management tools

  • “Touching” an existing file with touch updates its time stamp...
查看全文
加载更多
0%