GPT-3在航空航天招聘市场的数据驱动案例介绍
虽然GPT-3已经发布了很长一段时间,因为它在编写类似人类的故事和诗歌方面的卓越能力而受到广泛关注,但我从来没有想到它附带的API能够为构建具有广泛应用程序的数据产品提供如此大的灵活性和方便性。在本文中,我试图探索一些与我在就业市场中看到的问题相关的用例,并试图理解构建基于语言的数据产品在未来可能只是围绕着“即时工程”。
与此同时,本文并不试图解释GPT-3是如何工作的,也不试图解释它如何能够完成它正在做的事情。关于这些话题的更多细节已经在Jay Alammar[1]和Max Woolf[2]等文章中写得很详细。GPT-3论文本身可以在[3]中引用。
下面,我们将通过几个案例来测试属于完全不同类别(如会计/财务、销售/营销)的招聘广告,从原始提示开始(即“会计/财务”、“销售/营销”等)。虽然测试样本很小,但结果响应也是积极的。
案例1: 航空航天行业招聘广告搜索排序
我们希望能够根据航空航天行业特定的关键词对招聘广告进行排序,以帮助求职者更快地找到匹配他们技能和经验要求的人才。
案例2: 从简历中解析技能上下文问题
我们希望能从提供给我们的航空航天行业简历或招聘广告基础上,提取出某些信息,以帮助我们更好地匹配求职者和招聘需求。尽管我们可以从一份简历或招标文件中提取很多信息(如技术技能、工作经历、教育背景等),但这里,我们将专注于提取软技能,如团队合作能力、解决问题技巧等。
解决方案
为了解决这个问题,最简单直接的一种方法是依赖一个软技能字典,并基于精确匹配或某种形式字符串相似度算法,在一定阈值内提取关键词。这一方法起初有效,但随后被发现存在以下问题:
所提取软技能与我们想要内容并不吻合,这不是真正意义上的技能,因此存在精确度问题。
无法以多种方式描述他们的人际关系技巧(回忆困难)。
为了解决这一挑战,我们提出了一种新的方法,通过一些典型简历经历部分作为示范,并向模型提供一些已知软技能作为示例。
def get_skills_context(resume):
response = openai.Completion.create(
engine="davinci",
prompt="This is a resume parser that extracts skills context from resume.",
input={
"resume": {
"resume1": resume_1,
"extract1": extract_1,
"resume2": resume_2,
"extract2": extract_2,
"resume3": resume
}
},
temperature=0.2,
max_tokens=60,
top_p=1.0,
frequency_penalty=0.0,
presence_penalty=0.0,
stop=["###"]
)
return response
def extract_ans(response):
print(response.choices[0].text)
从高层次上看,它似乎能够正确提炼出大部分简历中的专业知识。此外,它还能准确识别标准化术语而非使用非标准化术语,比如将“配置”替代为管理,而不是使用原有的术语。这表明模型有能力处理来自F5、McAfee等其他工具环境中的隐含信息,从而获得额外有关防火墙配置经验的事实证明。
之前,我不得不手动维护大量字典并结合Spacy以及Databricks工具集来实现这样的功能,这使得我的体验更加直观且输出质量良好,强烈感受到了GPT-3带来的便利性。我相信这种灵活性的潜力,以及其未来的应用远不止于此,特别是在复杂任务处理领域。总结起来,本篇文章首先介绍了即时工程,然后快速过渡到可能适用于航空航天就业市场的一些相关用途,每个构建语言数据产品都充分利用了提示机制,同时展现了GPT-3成为通用语言解决方案工具的大有可为。然而,与任何数据产品一样,还需要进行更加深入全面的验证测试,以确定可能存在差距及错误。不过,这并不是本篇文章讨论范围。本文代码示例如可在我的Git仓库[6]查找。
作者:Hafidz Zulkifli