从azure datafactory执行storedProcedure-Java 学习之路

我试图从Azure DataFactory V2中的Azure文档DB中执行存储过程 . 该过程将使用平面表中的数据进行一些插入到不同的表中 . 根据MS spcifications，你需要有一个Table值参数来做这样的事情，但是它将管道活动耦合到过程和所有模型 . 有没有办法定义数据集和复制活动，所以它只是执行存储过程？

下面的jsons来自arm模板：

DataSet:    
{"type": "datasets",
          "name": "AzureSQLProcedureDS",
          "dependsOn": [
            "[parameters('dataFactoryName')]",
            "[parameters('destinationLinkedServiceName')]"
          ],
          "apiVersion": "[variables('apiVersion')]",
          "properties": {
            "type": "AzureSqlTable",
            "linkedServiceName": {
              "referenceName": "[parameters('destinationLinkedServiceName')]",
              "type": "LinkedServiceReference"
            },
            "typeProperties": {
              "tableName": "storeProcedureExecutions"
            }
          }}




    Activity:
    {"name": "ExecuteHarmonizationProcedure",
                    "description": "Executes the procedure that Harmonizes the Data",
                    "type": "Copy",
                    "inputs": [
                      {
                        "referenceName": "[parameters('destinationDataSetName')]",
                        "type": "DatasetReference"
                      }
                    ],
                    "outputs": [
                      {
                        "referenceName": "AzureSQLProcedureDS",
                        "type": "DatasetReference"
                      }
                    ],
                    "typeProperties": {
                      "source": {
                        "type": "SqlSink"
                      },
                      "sink": {
                        "type": "SqlSink",
                        //"SqlWriterTableType": "storeProcedureExecutionsType",
                        "SqlWriterStoredProcedureName": "@Pipeline().parameters.procedureName",
                        "storedProcedureParameters": {
                          "param1": {
                            "value": "call from adf" 
                          }
                        }
                      }
                    }
}

考虑到MS没有为此主题提供如此多的帮助，我们将不胜感激 .

2 回答

1
我不确定我是否正确理解了问题，您只是想从复制活动中调用存储过程？

这样做非常简单，在复制活动中，您可以在源代码中定义sqlReaderQuery属性 . 此属性允许您输入t-sql命令，因此您可以执行以下操作：
```
"typeProperties": {
        "source": {
            "type": "SqlSource",
            "sqlReaderQuery": "EXEC sp_Name; select 1 as test"
        },
 . . .
```
复制活动始终需要查询的结果，因此如果您只包含对存储过程的调用，那么为什么我不包含查询的第二部分 .

替换为您要使用的参数，就是这样 .
回复于 2024-04-29T12:07:22+08:00
2
按照@Martin的建议，我们设法让执行工作 . 以下是我们的所作所为：
- 在sql中创建虚拟表：
CREATE TABLE [dbo].[dummyTable]( [col1] [nvarchar](100) NULL )
- 在SQL中创建SP：
CREATE PROCEDURE [dbo].[sp_testHarmonize] @param1 NVARCHAR(200) AS BEGIN INSERT INTO storeProcedureExecutions VALUES (@param1,getdate()); END
- SP的数据集：
{ "type": "datasets", "name": "[parameters('dummySQLTableDataSet')]", "dependsOn": ["[parameters('dataFactoryName')]", "[parameters('datalakeLinkedServiceName')]"], "apiVersion": "[variables('apiVersion')]", "properties": { "type": "AzureSqlTable", "linkedServiceName": { "referenceName": "[parameters('databaseLinkedServiceName')]", "type": "LinkedServiceReference" }, "typeProperties": { "tableName": "dummyTable" } } }
- 管道活动：
{ "name": "ExecuteHarmonizationProcedure", "dependsOn": [{ "activity": "CopyCSV2SQL", "dependencyConditions": ["Succeeded"] }], "description": "Executes the procedure that Harmonizes the Data", "type": "Copy", "inputs": [{ "referenceName": "[parameters('dummySQLTableDataSet')]", "type": "DatasetReference" }], "outputs": [{ "referenceName": "[parameters('dummySQLTableDataSet')]", "type": "DatasetReference" }], "typeProperties": { "source": { "type": "SqlSource", "sqlReaderQuery": "@Pipeline().parameters.SQLCommand" }, "sink": { "type": "SqlSink" } } }
- 使用以下sql命令参数运行管道：
$"EXEC sp_testHarmonize 'call from ADF at {DateTime.Now}'; select top 1 * from dummyTable;"

这使它工作，但它看起来更像是一个工作而不是直接的解决方案，考虑到它在虚拟表上插入一行 . 如果没有更直接的解决方案，这是最简单的方法 .
回复于 2024-04-29T12:07:22+08:00

从azure datafactory执行storedProcedure

2 回答

相关问题