LangChain 是一个利用大语言模型 (LLM) 构建应用程序的开源框架。它可以结合 LLM 和各种信息源比如 Google Wikipedia,以创造出各式各样有趣的应用。而且,就像 Airflow 编排 ETL 数据管道一样,LangChain 能够编排多个 LLM 相关的任务进而组成 LLM 管道。
我在25岁学到的25件事
不知不觉到了25岁,打算总结一下过去25年学到的一些东西,于是我列了一个清单。有些很有意义,有些很扯,希望能带来一些启发。
25 Things I’ve Learned in 25 Years
Traversal of Binary Tree
北漂这两年
Statement of Purpose for Graduate School
Image Data Augmentation for OCR
深度学习模型经常受限于小数据集,我们可以使用数据增强 (Data Augmentation) 技术来生成更大规模更具多样性的训练集,从而提升模型的鲁棒性和性能。
Deep Learning models are data-greedy and often limited by small datasets. Data Augmentation techniques can be applied to boost training datasets, so that the performance and robustness of models may be improved.
Seq2Seq (Encoder-Decoder) and Attention Mechanism
对于循环神经网络,它的输入是一段不定长的序列,输出却是定长的。然而,很多问题的输出也是不定长的序列,比如机器翻译。当输入输出都是不定长序列时,我们可以使用编码器-解码器 (encoder-decoder) 来对其进行建模。
Introduction to LanguageTool
LanguageTool 是一款开源的语言校正软件,用于文本的风格检测和语法纠错。她是一个规则系统,拥有超过2000条规则和一个功能强大的规则解析器。本文介绍了如何使用和拓展 LanguageTool。
交叉验证的原理及实现
最近在写一个层次分类模型,为了更好地选择模型,用到了交叉验证,于是详细了解了一下。
Using Contextual Speller Techniques and Language Modeling for ESL Error Correction | Notes
Some notes on paper Using Contextual Speller Techniques and Language Modeling for ESL Error Correction.
使用上下文敏感的拼写检查技术和语言建模进行 ESL (English as a Second Language) 语法纠错。