Scala：Dataframe Merge-Java 学习之路

我在scala中有两个数据帧，我通过hive上下文使用sql查询创建它们，请在此处查看df作为图像

demand_df

另一个数据帧是

skill_map

请忽略第二个df中重复的 Headers ，我想比较两个数据框中的技能列，并获得等效的角色，技能2和df1中出现的即demand_df，

我在熊猫中试过这个并且能够通过使用以下代码段来实现

df1 = pd.DataFrame（[["INDIA"，"XXX"，"developer"，"UNKNOWN"，121]，["INDIA"，"XXXX"，"software engineer"，"UNKNOWN"，121]，["POLAND"，"XX"，"english"，"KNOWN"，122]]，列= ['country'， 'level'，'Skill'，'r2d2'，'tax']）
df2 = pd.DataFrame（[[_ "english"，"NaN"，"teacher"，"NaN"，"NaN"]，[20000，"Unknown"，"NaN"，"NaN"，"NaN"]，["microsoft"，"Known"，"Software Engineer"，"Microsoft"，"Enterprise"]]，列= ['Skill'， 'R2D2'，'Role'，'Skill2'，'Emerging']）

result = df1.merge（df2 [['Skill'，'Role'，'Skill2'，'emerging']]，how ='left'，left_on ='Skill'，right_on ='Skill'）

请指导我，因为我是斯卡拉的新手

1 回答