Gen TANG f6022ae91b update bold format преди 1 година
..
data 72894b83e0 ch05 finished преди 2 години
README.md f6022ae91b update bold format преди 1 година
categorical_variable.ipynb 72894b83e0 ch05 finished преди 2 години
continuous_variable.ipynb 2d95750b98 update comment for ch05 преди 2 години
multicollinearity.ipynb 2d95750b98 update comment for ch05 преди 2 години
one_way_anova.ipynb 2d95750b98 update comment for ch05 преди 2 години

README.md

概述

计量经济学(Econometrics)是经济学中的一个重要分支,它以数理统计学为基础,为经济理论提供实证支持。它运用数学模型分析真实数据,验证或推翻已有的经济理论。这一学科就如同经济研究的直尺,将研究由定性推进到定量。线性回归逻辑回归是该学科的核心模型。

经济学家凯恩斯曾稍显自负地声称

经济学家和政治哲学家的思想,无论对错,都比通常所想更为有力。这个世界实际上就是被这些思想统治着的,很少例外。讲求实际的人们自以为能够与所有精神世界中的影响绝缘,到头来不过是某位已故经济学家的奴隶。

这句话清晰地揭示了经济学理论对世界的巨大影响。因此,确保经济学理论的准确性至关重要。计量经济学作为验证经济理论的主要工具,对其核心模型有着很高的要求。虽然核心模型的结构相对简单,但这门学科在模型细节打磨方面积累了大量的技巧。这主要包括两方面:一是特征的处理,使其更好地被模型利用,这部分内容其实对应着人工智能领域的特征工程;二是尽可能确保模型的有效性、稳定性和可解释性。

第一部分的内容并不涉及模型结构,因此对所有模型都有帮助。第二部分的内容严重依赖于模型结构,因此,如果模型结构比较复杂,相应的分析会变得困难。但正如后文将提到的,复杂模型通常可以被分解成一个特征提取模型加线性模型(针对回归问题)或者逻辑回归模型(针对分类问题)。换言之,复杂模型的最外层其实就是计量经济学的核心模型,因此借鉴计量经济学的方法进行分析,有助于评估整体复杂模型的有效性和稳定性,也在一定程度上提供了模型的可解释性。尽管这种方法在理论上存在一些缺陷,但仍然不失为一种解决方案。

本章没有引入新的模型结构,但涵盖的内容对于大部分建模场景来说至关重要。

代码说明

代码 说明
categorical_variable.ipynb 定性特征的处理
continuous_variable.ipynb 定量特征的处理
multicollinearity.ipynb 多重共线性问题
one_way_anova.ipynb 利用one-way ANOVA检测定量特征与定性特征之间的多重共线性