首页 文章
  • 435 votes
     answers
     views

    用于访问列表或数据框元素的方括号[]和双括号[[]]之间的区别

    R提供了两种不同的方法来访问列表或data.frame的元素 - [] 和 [[]] 运算符 . 两者有什么区别?在什么情况下我应该使用一个而不是另一个?
  • 18 votes
     answers
     views

    如何从Perl中的PDF文件中提取文本?

    我试图使用Perl从PDF文件中提取文本 . 我一直在从命令行使用 pdftotext.exe (即使用Perl system 函数)从PDF文件中提取文本,这种方法工作正常 . 问题是我们在PDF文件中有像α,β和其他特殊字符的符号,这些符号没有显示在生成的txt文件中 . 在文本中随机添加的空格也很少 . 是否有更好,更可靠的方法从PDF文件中提取文本,使文本包含所有符号,如α,β等,文本将...
  • 23 votes
     answers
     views

    从PDF文件集合中提取表格内容[关闭]

    我有一堆PDF - 可能有数百或数千 . 它们的格式不一样,但是它们中的任何一个都可能有一个或多个表,其中包含我想要收集到单独数据库中的有趣信息 . 当然,我知道我必须写一些东西来做这件事 . Perl是我的选择 - 或者也许是Java . 我不关心什么语言,只要它是免费的(或者在免费试用期间便宜以确保它适合我的目的) . 我正在看CAM :: Parse(使用草莓Perl),但我不确定如何使...
  • 0 votes
     answers
     views

    BeautifulSoup - 使用“text =”在标签内提取文本

    正在阅读“使用Python进行Web Scraping”这本书并且它很不错,但有时(令人沮丧地)掩盖了读者需要在不显示输出或提及相关限制的情况下使用的代码 . 我花了4个小时试图找出原因: fullText.findAll('a', text="bees") 返回一个关于以下标记的空字符串: <a class="search">Why are ...
  • 0 votes
     answers
     views

    在使用aforge blob计数器检测矩形之后如何提取blob

    `// Process image private void ProcessImage(Bitmap bitmap){// lock image BitmapData bitmapData = bitmap.LockBits(new Rectangle(0,0,bitmap.Width,bitmap.Height),ImageLockMode.ReadWrite,bitmap.PixelForma...
  • 1 votes
     answers
     views

    SAS中特定子字符串的频率

    我无法弄清楚如何在字符串中提取特定文本 . 我的数据集已从去识别的电子 Health 记录中提取,并包含我们的患者开处方的每种药物的清单 . 然而,我只关注一个特定的药物清单,我在另一张表中 . 每个细胞内都有药物的名称,剂量和形式(标签,帽子等)[见图片] . 然而,大部分信息对我的分析并不重要,我只需要提取与我的清单相符的药物名称 . 从每个字符串中提取第一个单词也是有用的,因为它(在大多数情...
  • 0 votes
     answers
     views

    从ets中提取值:lookup() - Erlang

    我有一个ets表格式如下 ets:new(players, [set,named_table]) 放入表格的数据是球员姓名及其年龄 . 它的格式为[{Name,Age}] 我做了一个功能,试图让玩家年龄和年龄 . getPlayerAge(PlayerName)-> Player = ets:lookup(players,PlayerName), [{_,Age}] = Playe...
  • 1 votes
     answers
     views

    从pandas数据帧的列中提取主题标签

    我有一个数据框 df . 我想从推文中提取主题标签,其中Max == 45: Max Tweets 42 via @VIE_unlike at #fashion 42 Ny trailer #katamaritribute #ps3 45 Saved a baby bluejay from dogs #fb 45 #Niley #Niley #Niley 我尝试这样的东西...
  • 0 votes
     answers
     views

    从Php或cURL提取的网页上的链接中提取网址和锚文本

    Php Masters, 这是从谷歌抓取链接的代码 . <?php # Use the Curl extension to query Google and get back a page of results $url = "http://www.google.com"; $ch = curl_init(); $timeout = 5; curl_setopt($ch...
  • 0 votes
     answers
     views

    Tableau服务器服务帐户( 生产环境 ) - 提取问题

    我是tableau开发人员,我使用包含多个仪表板,数据源的tableau桌面创建了工作簿,同时创建了我使用过Extracts的工作簿 . 现在我已经登录了我公司的名为“Production”的共享tableau服务器并发布了我的工作簿, 生产环境 确实有数据库访问权限 . 但我在清爽提取物方面遇到了问题 . 提取不会刷新 - 尝试大多数可能的方式,如Relogin prod服务器,检查数据库连接,...
  • 1 votes
     answers
     views

    仅提取一个因子的GLM系数

    我正在为一些形式的物种运行一系列GLM: glm.sp<-glm(number~site+as.factor(year)+offset(log(visits)),family=poisson,data=data.sp) 请注意,年度术语是故意的因素,因为假设线性关系是不合理的 . 从该模型产生的年度系数是每年每个物种数量的度量,考虑到努力量(访问量) . 然后我想提取,取幂和索引(相对于去...
  • 1 votes
     answers
     views

    Azure函数 - SQL DB提取到输出Blob

    我参考了我在Stack上找到的下面的解决方案 . 它与我试图做的非常接近,但经过一周的尝试各种选择后,我并没有接近 . 我正在尝试编写一个Azure函数,它将从Azure数据库中提取所有数据并将结果输出到Blob存储 . 以下是我的尝试 . 在让所有其他人筋疲力尽之后,当然我对C#并不擅长,所以这可能是我的缺点 . 任何帮助将不胜感激 . 这是Azure功能: #r "System.Co...
  • 35 votes
     answers
     views

    通过机器学习从网页中提取信息

    我想在Python中使用 extract a specific type of information from web pages . 让我们说邮政地址 . 它有数千种形式,但仍然可以辨认出来 . 由于存在大量表单,因此编写 regular expression 甚至类似 grammar 并使用 parser generator 解析它可能非常困难 . 所以我认为我应该采取的方式是 machi...
  • 1 votes
     answers
     views

    批处理脚本以提取指定单词之间的行

    我有一个如下所示的日志文件 . [Tue Aug 19 10:45:28 2014] Local / PLPLAN / PL / giuraja @ MSAD / 2172 / Info(1019025)从数据库的规则对象读取规则[PL] [Tue Aug 19 10:45:28 2014] Local / PLPLAN / PL / giuraja @ MSAD / 2172 / Info(1...
  • 0 votes
     answers
     views

    提取具有重复sku的Excel行

    我有大约28,488行数据,每行分配一个(SKU) . 此工作表是(PRODUCT)表,代表一个包含101列的大型产品数据列表 . 在单独的工作表(即库存)表中,它具有每日更新的SKU列表,其中包含可用产品的数量 . 我想要做的是,从(PRODUCT)工作表中提取那些行(所有101列),这些行与INVENTORY工作表中的SKU相匹配 . 我曾经尝试过,并且未能成功: 我将从INVENTORY表中...
  • 1 votes
     answers
     views

    提取两个重叠栅格的数据

    我正在尝试提取两个重叠栅格集的数据(一个,一堆35个栅格,全部来自同一个源,第二个是高程栅格),以获取每个栅格的值(值的平均值)的data.frame所有栅格的像素 . 栅格堆栈的描述如下: > stack_pacifico class : RasterStack dimensions : 997, 709, 706873, 35 (nrow, ncol, ncell, n...
  • 46 votes
     answers
     views

    如何从.doc和.docx文件中提取纯文本? (unix)[关闭]

    任何人都知道他们可以推荐什么,以便从.doc或.docx中提取纯文本? 我发现这个Best way to extract text from a Word doc without using COM/automation? - 想知道是否还有其他建议? 速度并不重要,我们甚至可以使用具有一些API的网站上传和提取文件,但我一直无法找到 . 谢谢
  • 0 votes
     answers
     views

    从网站获取文本并每天自动化的指南

    我希望能够在特定时间每天从网站中提取文本 . 我希望自动化这一点,而不是每天自己手动更新文本文件 . 如果你们能指导我应该做什么以及应该学习哪些技能,我们将非常感激 . 如果有办法,我最好使用java来获取文本 . 任何帮助都会很棒!
  • 0 votes
     answers
     views

    VBScript没有执行命令提示命令?

    我使用以下VBScript代码来提取设置文件, Set oShell = CreateObject ("WScript.Shell") oShell.Run "cmd.exe ""C:\Program Files\NewFolder\setup.exe"" /extract:""C:\Program Fil...
  • 4 votes
     answers
     views

    是否可以从MJPEG流中捕获/保存JPEG? (还有MJPEG本身)?

    我正在使用MJPEG-Streamer通过http,similar to how this guy does it流式播放MJPEG视频文件 . MJPEG-Streamer基本上在流媒体设备上创建流媒体服务器,该服务器承载正在流传输的MJPEG视频 . 可以通过 http://<Server-IP-address>:8080/?action=stream 访问此流 . 一个例子是h...
  • 6 votes
     answers
     views

    Gradle - 从依赖的jar中提取文件

    我想从依赖的jasperreports.jar中提取文件“default.jasperreports.properties”并将其放入zip分发中,并使用新名称“jasperreports.properties” 示例gradle构建: apply plugin: 'java' task zip(type: Zip) { from 'src/dist' // from config...
  • 0 votes
     answers
     views

    Erlang,提取标签

    我试图从使用twiter api时检索到的列表中提取一个#标签 . 我用它来提取标签: case extract(<<"entities">>, L) of {found, {TE}} -> {found, Hashtags} = extract(<<"hashtags">>, TE...
  • 0 votes
     answers
     views

    在R中使用变量字符串条件从数据框中提取行

    将虹膜作为数据框,我想提取所有具有物种作为特定值的行和列变量(Petal.Length,Petal.Width,Sepal.Length,Sepal.Width) . 例如塞托萨 . 它应该显示50个条目 . 我尝试了聚合但没有工作 . 它是SQL中的等效和WHERE子句 .
  • 1 votes
     answers
     views

    R - 根据多个条件提取值

    我有2个数据帧,这里是代码: set.seed(100) x1= rnorm(4) x2= rnorm(4) x3= rnorm(4) x4= rnorm(4) x5= rnorm(4) x6= rnorm(4) x7= rnorm(4) x8= rnorm(4) x9= rnorm(4) x10= rnorm(4) df1 = data.frame(Station1 = x1, Station...
  • 1 votes
     answers
     views

    夏令时错误

    我想计算不同时区的日期之间的时差 . 我将这两次转换为格林威治时间 . 但是当我在 Europe/Moscow 时区转换日期时,偏移量是不同的,尽管没有夏令时 . 这是我检查的情况: SELECT TO_DATE('5/20/2018 10:05:00 PM','mm/dd/yyyy hh:mi:ss am'), TO_DATE('5/20/2018 10:05:00 PM','mm...
  • 1 votes
     answers
     views

    R多元回归循环和提取系数

    我必须对同一自变量矩阵的许多因变量向量进行多元线性回归 . 例如,我想创建3个模型,以便: lm( d ~ a + b + c ) lm( e ~ a + b + c ) lm( f ~ a + b + c ) 来自以下矩阵(a,b,c是自变量,d,e,f是因变量) [,1] [,2] [,3] [,4] [,5] [,6] [1,] a1 ...
  • -1 votes
     answers
     views

    如何从外部链接的细胞范围中提取绝对细胞参考?

    是否有一种简单的方法(而不是手动复制和粘贴)只从excel中的外部链接单元格范围中提取绝对单元格引用? 我不需要外部参考的“表格 Headers ”部分;只是绝对单元格引用为字符串
  • 0 votes
     answers
     views

    在simulink中对输出信号进行归一化/变换/整形,以便仅构建连接的尖峰值

    我有一个simulink系统构建和系统输出 . 输出在峰值/尖峰中具有有 Value 的数据点,而在数量为70的非有 Value 的数据点中具有有 Value 的数据点 . 我正在努力实现的是输出信号,仅由直接相互连接的有 Value 数据点组成(基本上,这些是我需要的数据点) . 在将原稿作为具有时间的结构提取到工作空间中之后,我附加了来自示波器的原始输出信号和我在matlab中构建的输出信号 ...
  • 435 votes
     answers
     views

    用于访问列表或数据框元素的方括号[]和双括号[[]]之间的区别

    R提供了两种不同的方法来访问列表或data.frame的元素 - [] 和 [[]] 运算符 . 两者有什么区别?在什么情况下我应该使用一个而不是另一个?
  • 0 votes
     answers
     views

    无法迭代分配日历ID以从Google日历中提取事件

    我一直在尝试创建一个工作脚本来从不同的人日历中提取事件 . 可以访问以读取事件 . 我在A2:B4列 Headers A(Cal_ID)和B(活动)范围内的不同表(“Cals2Extract”)中有ID . 虽然我能够从A2列中的第一个名称中提取事件,但我无法遍历A列中的第二个和第三个名称(A3,A4 ....) . 提取的事件写在不同的工作表(EventCal)中 . Sample Sheet ...

热门问题