##关于NLP面试(摘录)

面试要点整理

  • 发展史
  • 难点
    • 词义消歧
    • 指代消解
    • 上下文理解
    • 语义语用的不对等(难度max)->对语言的理解(经验)
  • NLP应用
    • 医疗方面
    • 教育方面
    • 媒体
    • 金融
    • 法律
  • 常见工具
    • 一些基本的工具包
    • 分词器(大概原理)
    • 机器学习
    • 深度学习
  • 自然语言处理和机器学习
    • 逻辑回归(手推)
    • 朴素贝叶斯模型
    • K
    • SVM(最大间隔,KKT,核方法)
    • 决策树
    • 集成方法
  • 自然语言处理和深度学习
    • CNN(画图,公式运算)
    • RNN
    • attention
    • self-attention
    • transformer
    • bert
  • 文本预处理
    • 文本获取
    • 流程(去除噪声,词性标注。。。)
    • 数据不平衡处理
  • 文本表示
    • tf-idf
    • word2vec
      • CBOW
      • Skin-Gram(原理,训练技巧)
    • fasttext,glove,elmo(了解)
  • 句子方面的向量
    • sif
  • 系列标注
  • 基于概率模型的方法
    • HMM
    • MEMM
    • CRF
  • 基于深度学习
    • Bi-LSTM + CRF
  • 关系抽取
    • Bootstrap
    • 深度学习的方法
  • 文本聚类
    • 划分法
    • 层次法
    • 基于密度
    • 基于网络
    • 应用:数据整理、用户画像、数据可视化
  • 文本分类
    • 机器学习
    • 模型融合
    • 深度学习
    • 二分类
    • 多分类
    • 多标签
  • 文本摘要
    • 抽取式的
    • 压缩式
    • 重组法
  • 语言生成
    • 语言模型
    • 深度学习
    • 写诗机器人
    • 聊天任务
  • 机器翻译
    • 发展史(了解)
    • 技术
      • attention
      • self-attention
      • bert
  • 聊天系统
    • 类型
      • 闲聊
      • 知识问答
      • 任务型(多轮)
    • 任务型
      • 意图识别
      • 词槽填充
      • 对话管理
      • 数据库
      • 对话生成
      • 强化学习

问题种类

  • 常规问题
    • 项目
    • 应用场景
    • 私人信息

如何选择公司

  • 人员
  • 项目
  • 工作强度
    • 研究?
    • 开发?