Ethan's Blog


  • Home

  • Archives

  • Tags

  • Search

《面试宝典》读书笔记 Ⅰ

Posted on 2017-04-30

基本概念、面向对象技术

Java 语言的优点

纯面向对象语言

能够直接反应现实生活中的对象。

平台无关性

由于 Java 为解释型语言,编译器会把 Java 代码变成中间代码,然后在 JVM 上解释执行。
中间代码与平台无关,可以很好地跨平台执行,具有很好的可移植性。

提供了很多内置的类库

简化了开发人员的程序设计工作,同时缩短了项目开发的时间。
对多线程的支持、对网络通讯的支持、垃圾回收器。

Read more »

Python 语言精要 Ⅰ

Posted on 2017-04-27

常常得先把那些乱七八糟的数据,处理成漂亮点的结构化形式。

Python 解释器

一次执行一条语句。
“>>>”是提示符,可以在那里输入表达式。

语言语义

重视可读性、简洁性、明确性,可执行的伪代码。

缩进,而不是大括号

通过空白符(4 个空格)来组织代码。
冒号表示一段缩进代码块的开始,其后必须缩进相同的量,直到代码块结束为止:

Read more »

决策树

Posted on 2017-04-25

基本流程

决策过程中提出的每个判定问题都是对某个属性的测试
考虑范围在上一次决策结果的限定范围之内

  • 叶结点对应于决策结果
  • 其他每个结点对应于一个属性测试
  • 根结点包含样本全集

目的

决策树学习的目的是为了,产生一棵处理未见示例能力强的决策树。
遵循简单且直观的分而治之(divide-and-comquer)策略。

Read more »

线性模型

Posted on 2017-04-06

基本形式


xi 是 x 在第 i 个属性上的取值。
w 和 b 学得之后,模型就得以确定。
许多功能更为强大的非线性模型(nolinear model)可在线性模型的基础上,通过引入层级结构或高维映射而得。
w 直观表达了各属性在预测中的重要性,因此线性模型有很好的可解释性(comprehensibility)。

Read more »

模型评估与选择

Posted on 2017-03-29

训练误差与过拟合

精度(accuracy),精度 = 1-错误率。

  • 在训练集上的误差称为训练误差(training error)
  • 在新样本上的误差称为泛化误差(generalization error)

实际希望的,是在新样本上能表现得很好的学习器。

  • 过拟合(overfitting):把训练样本自身的一些特点,当作了所有潜在样本都会具有的一般性质。
  • 欠拟合(underfitting):对训练样本的一般性质尚未学好。

过拟合是无法彻底避免的。若可彻底避免过拟合,则通过经验误差最小化就能获得最优解。

评估方法

以测试集的测量误差(testing error)作为泛化误差的近似。
测试集应该尽可能与训练集互斥,通过对数据集 D 进行适当的处理,从中产生训练集 S 和测试集 T。

Read more »
1…525354
necusjz

necusjz

270 posts
16 tags
© 2016 - 2026 necusjz
Powered by Hexo
Theme - NexT.Mist