数据驱动的科技开启GPT-3在招聘市场的案例分析
随着GPT-3的发布,它凭借在撰写故事和诗歌等人类文艺作品方面的卓越能力,吸引了广泛关注。然而,我从未想到它附带API能为构建具有广泛应用程序的数据产品提供如此大的灵活性和便捷性。在本文中,我将探索与我在就业市场中遇到的问题相关的一些用例,并试图理解未来基于语言的数据产品可能围绕“即时工程”。
本文并不详细解释GPT-3是如何工作或完成其任务,这些细节已有Jay Alammar[1]、Max Woolf[2]以及原始论文[3]中详尽阐述。本节下面几个示例,我们尝试测试不同类别(如会计/财务、销售/营销)的招聘广告,从原始提示开始。尽管样本数量有限,但响应结果正面。
值得一提的是,模型能够处理马来语输入,而无需先将文本翻译成英语。
案例
1. 工作搜索排序
我们希望基于提供的招聘广告或简历,提取信息以更好地匹配求职者和招聘岗位。
虽然可以从简历/广告中提取许多信息(如技术技能、工作经历、教育背景等),但这里我们专注于软技能。
解决方案
最简单方法是依赖软技能字典,并基于精确匹配或字符串相似度算法在某个阈值范围内提取关键词。一开始有效,但很快遭遇挑战:
所提取软技能与期望内容不符(存在精确度问题)。
无法多种方式描述他们(回忆问题)。
我们的目标是在一些经典简历部分示例上解决此问题,并向其提供一些可用的软技能示例。
def get_skills_context(resume):
response = openai.Completion.create(
engine="davinci",
prompt="这是一个简历解析器,它从简历中抽取skills context。",
resume="{resume}",
parsed_contextual_skills="{extract}",
temperature=0.2,
max_tokens=60,
top_p=1.0,
frequency_penalty=0.0,
presence_penalty=0.0,
stop=["###"],
)
return response
def extract_ans(response):
print(response.choices[0].text)
高层次上看,它似乎能准确捕捉大部分简历中的技能。特别有趣的是,“配置”而不是“管理”(源自“管理”)被标准化。此外,还能添加“配置防火墙”,这是一项根本没有出现在简历中的能力,但可能暗指F5、McAfee等工具。
之前不得不自己构建类似系统使用Spacy、Databricks及手动维护字典组合,但结合输出质量和构建简单性,我对GPT-3更加欣赏。
总结,本篇文章首先介绍了即时工程,然后迅速转向可能适用于GPT-3就业市场行业的一些相关用例每个数据产品都体现了通过提示实现的大量可能性,以及这些结果——证明了GPT-3成为解决基于语言任务通用工具具备巨大潜力。话虽如此,与任何数据产品一样,还需要更全面的验证测试来确定差距与错误。不过,这超出了本篇文章范围。本文代码可在我的Git repo [6] 中找到。
作者:Hafidz Zulkifli