统计软件

作者

Simonzhou

发布于

2025年2月22日

修改于

2025年5月22日

一些统计软件的使用记录。

最早是学的Python,应该是20年的时候,看的MOOC上的北理嵩天老师的课程,过了一遍,没有深入研究。

后来学的SPSS,21年,因为开始上统计学课了,课上老师用SPSS做分析演示,我还负责给全专业分发SPSS安装包和密钥,并帮他们安装。

21年还试着用过MATLAB,因为20年的时候数学老师说可以准备数学建模的比赛,20年疫请然后没人管事,21年计算机学院的一位老师担下了这个活,随机我们组队在21年秋天比赛,但是数理教研组所承诺的培训和指导都是泡影,我和队友在数理教研室办公室待了两个晚上,不断地从互联网上查找相关的资料和代码,然后在MATLAB中进行复现,其实这个时候的认识和技能是很糟糕的,数学上了微积分和线代,但是和建模关系最大的运筹学要在大二的下学期才上。就这样,紧张又无聊的三天就这么过去了,现在来看(2025年)真的是既心酸又好笑,但是也不失为一个有趣的记忆。

21年写完大创的论文后,就逐渐没有再关注这些软件的使用了,因为用不上,直到23年毕业的时候,又拿着SPSS做了一下毕业论文的分析。

23年毕业后,选择了二战,暑假又回了学校和同学租房备考,在逛丁香园的时候,发现本校的一位老师在上面更新了Rmarkdown的课程,我好奇,随机花了一周的时间学了一下,是一个很好用的“thing”,结合了R、Markdown和LaTeX。正好当时需要整理统计学的笔记,随开始尝试并使用。

其实23年的时候Posit已经在开发Quarto了,但是新事物到达普通人的视野中总是需要多耗费一些时间,到了24年我才知道有这么个“thing”,但是后面的学习节奏,不允许我抽出大量的时间来“改换门庭”。同时我的Rstudio一直无法正确的创建和使用Quarto,和社区交流后无果,只能使用VS Code来作为编辑器。

直到24年考完空闲下来,我才开始系统地转换这个笔记并重新部署在GitHub上。

24年上半年在长沙的时候,二战失败,五月找工作也失败。安慰自己说,没事,我可以干点别的,就重新开始学Python,并尝试学了SAS。

25年开年朋友请我帮他做一些Stata的分析,我便拿出了22年朋友送的《Stata统计分析·社会科学应用指南》开始速成,得益于AI的发展,专供某一个方向也是不难的。在这种理解下,我开始系统地学习统计学和数据分析的内容,这个网站被用来记录和整理相关的内容与想法。

我也不知道最后会学成什么样,但是希望能留下一些有意义的东西,以供后来者。

2025-04-28 Stata作为一个商业软件,确有其独到之处,稳定,简便,支持很好是很好的有点,相较于R的开源与不稳定,这在多次使用与复现中是很重要的一点。最近在用R做概率图模型的时候就复现不出来,功能强大是优点,但是无法复现也就意味着断层,对于学习者来说是一件很麻烦的事情。

2025-04-29 昨晚弄好 Stata 18 以后,晚上想起 Stata 官网说可以和 Python 联用,开发了包在 Ipython 中调用 Stata ,这很有意思,我在想,既然 Quarto 可以编译 .ipynb 文件为 PDF、html 等文件,那么是否可以在 Quarto 中使用 .ipynb 文件做一个容器,然后将 Satat 程序放在里面进行编译后,再由 Quarto 生成 html 文件,最后再组成网站,可以无损/流畅地展示 Stata 程序和输出结果。网上有 Python + Stata 结合使用的相关信息,但是没有和 Quarto 配合的,于是自己进行尝试,成功,能够实现在 .ipynb 中编辑 Stata 代码,并通过 Quarto 编译成网页,在网站进行展示。

2025-05-05 看着桌边的 《SAS统计软件应用》,想了一下 SAS ,软件自带的编辑器很糟糕,又想,vscode 是万能编辑器,是不是也有 SAS 的扩展,搜了一下,嘿,还真有,那是不是也可以像 Stata 一样通过 .ipynb 文件进行编辑和运行,然后通过 Quarto 进行编译转为 .html 文件然后网页输出,看了下也是可以的,有趣,感觉 Quarto 真的可以借助 .ipynb.qmd/rmd 实现统计软件的展现大一统。

2025-05-11 昨天学完了stata的初级课程,今天开始捣鼓advanced course,一直听闻实证分析的妙用,有点抽象,而且没有找到特别合适的课程,Princeton 的一些教案挺好的,对着教案翻译然后跑代码,复现还可以。