Java 学习之路

1 votes

answers

views

调试u-sql Jobs

我想知道是否有任何提示和技巧可以在数据湖分析工作中找到错误 . 大多数情况下，错误消息似乎不是很详细 . 当尝试从CSV文件中提取时，我经常会收到这样的错误顶点故障触发了快速作业中止 . 顶点失败：SV1_Extract [0]>>错误：顶点用户代码错误 . Vertex因失败快速错误而失败在尝试将列转换为指定类型时，似乎会发生这些错误 . 我发现的技术是将所有列提取到字符串...

azure-data-lake u-sql
0 votes

answers

views

错误ID：VertexFailedFast，错误消息：顶点失败并出现故障快速错误

当我运行下面的U SQL我得到“活动U-SQL1失败：错误ID：VertexFailedFast，错误消息：Vertex因失败快速错误而失败 . “ 输入架构有7列 . 但我仍然得到这个错误 . 我也跳过第一行，因为它包含 Headers . DECLARE @file_set_path string ="/Sample_{*}.csv"; @searchlog = ...

azure pipeline azure-data-factory u-sql
4 votes

answers

views

ADF触发ADL作业失败，出现语法错误

我正在尝试运行从Visual Studio中成功运行的作业 . 我想在我的ADF管道中运行它，但作业失败并出现语法错误 . ERRORID: E_CSC_USER_SYNTAXERROR SEVERITY: Error COMPONENT: CSC SOURCE: USER MESSAGE: syntax error. Expected one of: '[' end-of-file ...

azure-data-lake u-sql
1 votes

answers

views

Azure Data Lake U-SQL作业失败并显示错误：JM_FinalMetadataOperationUserError

我一直在Azure Data Lake上运行U-SQL作业，更新分区表并且它们运行成功，但在“Finalizing”阶段失败并出现错误“JM_FinalMetadataOperationUserError”，堆栈跟踪如下： Object ec2d8ab3-6df5-48eb-9169-daec48bf27a6.DeployedLogs.dbo.ConcurrentRecord__1__System...

azure-data-lake u-sql
2 votes

answers

views

当工作准备时间超过25分钟时，数据湖工作失败

我在Data Lake处理大约4000个csv文件的输入文件集，当作业准备时间超过25分钟时，作业失败并出现脚本编译错误我们要求批量处理超过4000个csv文件，我听说微软有一个预览解决方案来处理输入文件集大小大到30,000个文件

azure-data-lake u-sql
0 votes

answers

views

DataLake Analytics USQL：无法比较数组中的两个元素

我在Data lake Analytics中创建了一个数据库 . 然后填充数据湖中文件的数据 . 当我查询我所做的表时，我有一些成功，但有些奇怪的错误 . （对我来说很奇怪！）这有效：WHERE [Stamped Serial number] ==“000074O1”这不：WHERE [CTN Number] ==“000074-1” 错误： “代码生成期间发生了系统故障 . 无法比较数组中...

azure-data-lake u-sql
2 votes

answers

views

顶点故障触发快速作业中止 - 数据提取期间抛出异常

我正在运行数据湖分析工作，在提取期间我收到错误 . 我在我的脚本TEXT提取器和我自己的提取器中使用 . 我尝试从包含两个以空格字符分隔的列的文件中获取数据 . 当我在本地运行我的脚本时，一切正常，但是当我尝试使用我的DLA帐户运行脚本时 . 我只有在尝试从包含数千行（但只有36 MB数据）的文件中获取数据时才遇到问题，对于较小的文件，一切都能正常工作 . 我注意到当顶点的总数大于提取节点的顶点时...

azure azure-data-lake u-sql
2 votes

answers

views

ADLA XMLExtractor无法读取属性？

我一直在使用示例XMLExtractor（从https://github.com/Azure/usql/tree/master/Examples/DataFormats克隆）从我的xml元素中提取属性 . 如果根元素具有任何已定义的属性，则提取器将无法工作 . 例如，我需要从以下XML文件中获取“rec”元素的“sTime”属性： <lics xmlns="***" lV...

azure-data-lake u-sql
0 votes

answers

views

从BCP CSV文件中提取U-SQL错误

我有使用BCP从SQL Server中提取的数据，该文件是ASCII CSV .日期为2016-03-03T23：00：00格式 . 当我运行提取物时附加信息： {“diagnosticCode”：195887127，“severity”：“错误”，“组件”：“RUNTIME”，“source”：“User”，“errorId”：“E_RUNTIME_USER_EXTRACT_COLUMN_C...

azure-data-lake u-sql
0 votes

answers

views

在Azure Blob存储中从DLL创建USQL程序集

我正在尝试从位于 Azure Blob Storage 的DLL创建Data Lake Analytics数据库程序集 . 根据USQL语言参考指南，这是可能的，虽然没有给出任何需要进入FROM引用的例子... https://msdn.microsoft.com/en-us/library/azure/mt763293.aspx 这是我的USQL代码段 . CREATE ASSEMBLY IF ...

azure dll azure-data-lake u-sql
1 votes

answers

views

如何处理回车，在带引号的字符串中换行

我想使用Azure Data Lake处理的多个源系统包含回车符，列中包含换行符 . 这会导致ADLA中的Extract失败，并显示以下错误： E_RUNTIME_USER_EXTRACT_UNEXPECTED_ROW_DELIMITER 试图找到一个工作配置不再遇到这个问题 . Microsoft.com上的本机Extractor文档描述了这一点：请注意，引用字符串中的rowDelim...

azure-data-lake u-sql
0 votes

answers

views

如何从csv输入文件中包含ADLA中的所有列？

我在ADLA的输入数据文件中有300列 . 我需要包括整个数据集而不是几列 . @searchlog = EXTRACT UserId int , Start DateTime , Region string , Query string , Durati...

azure-data-lake u-sql
2 votes

answers

views

USQL调用不带密钥读取json数组

我有一个嵌套的json，我试图在usql中展平 . 我无法共享数据，但结构与此类似 . { "userlist": [user1, user1], "objects": { "largeobjects": [object1, object2, object3] "smallobje...

json azure azure-data-lake u-sql
2 votes

answers

views

Data Lake Analytics：自定义输出器写入不同的文件？

我正在尝试为U-SQL编写一个自定义输出器，它根据一列中的数据将行写入单个文件 . 例如，如果列的日期为“2016-01-01”，则会将该行写入具有该名称的文件，并将下一行写入具有相同列中值的文件 . 我的目标是通过在输出器中使用Data Lake Store SDK来实现这一点，该SDK创建一个客户端并使用SDK函数写入单个文件 . 这是一个可行且可行的解决方案吗？我已经看到要为输出器重写的函...

azure-data-lake u-sql
0 votes

answers

views

U-SQL列类型转换

我创建了一个U-SQL查询，它从DataLake Store获取输入文件并转换值 . 最终输出存储在DataLake Store中 . DECLARE @in string = "system/dbotable{*}.tsv"; DECLARE @out string ="system/temp.tsv"; @searchlog = EXTRACT...

azure-data-lake u-sql
1 votes

answers

views

[U-SQL]] [FlexExtractor]我无法加入 . 表达式必须都是列

我正在使用Cortana Analytics Suite . 目前正在使用包含数百列的文件的visual studio数据湖分析项目分析Data Lake商店的数据 . 在阅读了u-sql文档后，我发现了一个flex提取器来帮助解决这个问题（百列） . flex flexctor与一张 table 完美配合 . 问题从加入表开始，我在编译时收到此错误： “错误E_CSC_USER_JOINCOL...

azure azure-data-lake u-sql
0 votes

answers

views

在U-SQL中提取部分文件名时没有数据输出

当我从多个文件中提取并在字段列表和FROM子句中包含部分文件名时（例如FROM“/input/filename-{filedate:*} .nc”），生成的输出文件只包含一个 Headers 行 . 如果我从字段列表和FROM子句中删除“filedate”，我会得到正确的输出 . 我在工作图中注意到，当包含“归档”时，在“PodAggregate”步骤之前添加“空输入”和“提取交叉”步骤，并且在“...

azure-data-lake u-sql
1 votes

answers

views

使用其他表从提取器过滤数据

我正在尝试使用csv自定义提取器从多个文件中提取数据，该提取器使用基于其他文件内容的过滤器 . 防爆 . Files.txt内容 file1 file4 目录结构 /file1/file.txt /file2/file.txt /file3/file.txt /file4/file.txt 我已将Files.txt内容解压缩到rowset @files，将目录中的文件解压缩到@filesDi...

azure-data-lake u-sql
2 votes

answers

views

U-SQL中具有多个文件的多个目录，没有日期时间

我想使用没有日期时间的U-SQL从多个文件夹中读取多个文件 . 文件夹结构是输入input1 file1.csv file2.csv input2 file3.csv

azure-data-lake u-sql
0 votes

answers

views

使用U-SQL遍历文件夹

我正在尝试使用U-SQL读取文件的完整父目录，无论它在源目录结构中有多深 @searchLog = EXTRACT FileName string, , Path string , UserId int , Start DateTime , Region string , Query string , Duration int , Urls string , ClickedUrls string ...

azure-data-lake u-sql
1 votes

answers

views

使用自定义JsonExtractor的gz的U-SQL提取失败

我在提取过程中遇到异常，同时尝试使用带有gzip压缩文件的 Microsoft.Analytics.Samples.Formats 库中的自定义 JsonExtractor . Microsoft.Cosmos.ScopeStudio.BusinessObjects.Debugger.ScopeDebugExceptionwasunhandledMessage: Anunhandledexcep...

azure azure-data-lake u-sql
-2 votes

answers

views

u-sql脚本无法从数据集中获取标量值

在u-sql脚本中，我必须从文件中提取变量到数据集，然后使用它来形成输出文件的名称 . 如何从数据集中获取变量？详情 . 我有2个输入文件：带有一组字段和字典文件的csv文件 . 第一个文件的文件名如**** ClintCode ***** . csv . 第二个文件字典有2个带映射的字段：ClientCode - ClintCode2 . 我的任务是从文件名中提取ClientCode值，从...

u-sql
1 votes

answers

views

u-sql无法处理null

我正在尝试azure datalake，并试图在我的测试文件上测试u-sql . 这是我的测试脚本 @input = EXTRACT TagName string, time DateTime, valuee float, Quality int FROM "/...

azure-data-lake u-sql
0 votes

answers

views

选择要从USQL中的CSV文件中提取的行

我正在尝试从CSV文件中提取几列 . 此文件每天都会替换，并且可以将列添加到文件中 . 我的问题是，每次更改列数我需要更新USQL代码...任何帮助？ @billing = EXTRACT id string, company string FROM @companydatafile USING Extractors.Cs...

azure-data-lake u-sql
1 votes

answers

views

USQL查询大文件

我在Azure Data Lake商店中有一个非常大的文件（257 gb），当我昨天尝试对其进行简单的提取时，我收到以下错误顶点运行超过5小时后终止 . 具有guid {2F8802B8-F93A-47EE-80E2-274590BD76A5}的顶点SV1_Extract_Partition [0] [53] .v0的输入大小为1.171594 GB . 在大多数情况下，这是由数据偏差引起的，...

azure-data-lake u-sql
1 votes

answers

views

U-SQL语句中的动态FROM

我试图在U-SQL中生成动态FROM子句，以便我们可以根据以前的查询结果从不同的文件中提取数据 . 这是这样的： @filesToExtract = SELECT whatevergeneratesthepaths from @foo; <-- this query generates a rowset with all the file we want to extract like: [...

azure-data-lake u-sql
1 votes

answers

views

如何定义日期范围，然后在USQL中查询复杂文件集？

单个文件中有很多很好的USQL示例 . 但是，您如何复制一个非常常见的数据处理示例，在该示例中，您希望获取当前系统时间，从该时间减去X天数并根据该结果查询一组数据？对于SQL示例： SELECT * FROM MyTable WHERE Date >= CAST(GETDATE() AS DATE) - 30 AND Date <= CAST(GETDATE() AS DATE) - ...

azure azure-data-lake u-sql
0 votes

answers

views

USQL提取文件的子集

我有一个USQL问题 . 我有一个日常工作，即以下列格式将文件输出到目录 /MyOutput////file.csv 我现在有第二份工作要运行，它将使用第一份工作生成的最新30个文件 . 我无法弄清楚如何最好地做到这一点 . 我知道我可以在提取器中做通配符，但我不想提取所有文件，然后使用select / where去除我不想要的文件，因为提取所有文件可能会花费很多，如果我保持多年的 Value 文...

azure-data-lake u-sql
1 votes

answers

views

在U-SQL中提取JSON行

我将数据存储为文件中每行的JSON对象 . 在U-SQL脚本中提取它的好方法是什么？我已经使用Text Extractor工作了（参见下面的代码）但是JSON对象变大了，我遇到了字符串的128KB大小限制 . 任何帮助将不胜感激 . 样本数据： { "prop1": "abc", "prop2": "xyz" } {...

c# json u-sql
0 votes

answers

views

如何将大型JSON阵列文件加载到Azure Data Lake Analytics（ADLA）中

我被困在Azure Data Lake Analytics挑战中，正在寻求帮助 . Issue 我需要从Azure Data Lake加载一个文件，该文件包含大约150米的JSON数据行，存储为JSON对象数组 . 该文件大小约为110G . 当我尝试加载文件时，ADLA似乎挂起，几小时内“0％”进度，并且algebra.xml或其他文件没有状态更新 . 通过在线文档搜索，似乎ADLA仅限于“单个...

json azure utf-8 analytics u-sql

热门问题