我正在尝试GPG加密spark数据帧列 FName
df = spark.createDataFrame([('Andy', 'NY'), ('Bob', 'PA'), ('Cindy', 'DC')], ("FName", "City"))我创建了一个udf,它将字符串值作为输入,并将加密字符串作为输出。
gpg = gnupg.GPG(gnupghome='/home/testgpguser/gpghome')encrypt_str = udf(lambda string_value: gpg.encrypt(string_value, 'myrecepeintemailid', passphrase='mypassphrase'))我正在申请我的udf如下:
df = df.withColumn('Encrypted_FName', encrypt_str(col('FName')))但是,我认为整个列都已通过,并且它没有正确加密值。
如何遍历数据帧的每个值并将其传递string_value给udf?