##关于NLP面试(摘录)
面试要点整理
- 发展史
- 难点
- 词义消歧
- 指代消解
- 上下文理解
- 语义语用的不对等(难度max)->对语言的理解(经验)
- NLP应用
- 医疗方面
- 教育方面
- 媒体
- 金融
- 法律
- 常见工具
- 一些基本的工具包
- 分词器(大概原理)
- 机器学习
- 深度学习
- 自然语言处理和机器学习
- 逻辑回归(手推)
- 朴素贝叶斯模型
- K
- SVM(最大间隔,KKT,核方法)
- 决策树
- 集成方法
- 自然语言处理和深度学习
- CNN(画图,公式运算)
- RNN
- attention
- self-attention
- transformer
- bert
- 文本预处理
- 文本获取
- 流程(去除噪声,词性标注。。。)
- 数据不平衡处理
- 文本表示
- tf-idf
- word2vec
- CBOW
- Skin-Gram(原理,训练技巧)
- fasttext,glove,elmo(了解)
- 句子方面的向量
- sif
- 系列标注
- 基于概率模型的方法
- HMM
- MEMM
- CRF
- 基于深度学习
- Bi-LSTM + CRF
- 关系抽取
- Bootstrap
- 深度学习的方法
- 文本聚类
- 划分法
- 层次法
- 基于密度
- 基于网络
- 应用:数据整理、用户画像、数据可视化
- 文本分类
- 机器学习
- 模型融合
- 深度学习
- 二分类
- 多分类
- 多标签
- 文本摘要
- 抽取式的
- 压缩式
- 重组法
- 语言生成
- 语言模型
- 深度学习
- 写诗机器人
- 聊天任务
- 机器翻译
- 发展史(了解)
- 技术
- attention
- self-attention
- bert
- 聊天系统
- 类型
- 闲聊
- 知识问答
- 任务型(多轮)
- 任务型
- 意图识别
- 词槽填充
- 对话管理
- 数据库
- 对话生成
- 强化学习
- 类型
问题种类
- 常规问题
- 项目
- 应用场景
- 私人信息
如何选择公司
- 人员
- 项目
- 工作强度
- 研究?
- 开发?