我有一个值 empID(may 的小数据框,其中有 10 行。如果 empID 匹配,我需要从 Hive 表中获取员工的其他详细信息。雇员配置单元表具有数百万条记录。

如何查找匹配项并以有效方式获取其他详细信息。

现在,我已将完整的 employee 表加载到内存中,并尝试从数据框中匹配 empID,并在 id 匹配的情况下读取值。这需要很长时间才能完成,请提出其他替代方案以加快此过程。

预先感谢您的帮助。

谢谢,鲍勃