首页 文章
  • 0 votes
     answers
     views

    使用python和mongodb进行队列分析

    我已经完成了跟踪活动用户的功能,这些用户一直在使用我的应用程序并查看他们的进度 . 实际上,我已经制作了功能,以便对我的用户进行群组分析! 我的想法是(群组分析)选择时间段(例如2012年10月1日至2013年10月1日),在我的案例中将所有使用app的用户放在第一个月(2012年10月1日至01/11月/ 2012),然后在剩下的选定月份中确定他们的进展!(我的意思是“进步”,如果他们下个月使用...
  • 0 votes
     answers
     views

    在R中创建群组分析表

    我必须创建一个类似于这样的队列分析表:Final Form 而且,我有以下形式的数据: 每行代表一个唯一的ID . 我在编写代码时遇到问题,代码会将数字的变化从0映射到1或2,然后在同一特定行中返回0 . 最终表中的月份列应包含从一个月到另一个月的所有特定行/ ID的所有幻灯片的总和 . 这些幻灯片可以是0到1或2,然后在随后的几个月中返回 . 数据中的所有NA都将被忽略 . 只有在新用户进入时才...
  • 0 votes
     answers
     views

    ASP.NET Web应用程序中的代码分析

    我正在使用VS 2010;这些天我对类库进行了令人难以置信的runnig代码分析 . 但对于Web应用程序,带有ddl,pnl等前缀的UI控件名称会导致代码分析警告为“更正拼写...” . 我用谷歌搜索并认为这可以使用规则集解决;但是没有办法压制这些......指针?
  • -5 votes
     answers
     views

    用java简单的情感分析

    我对Sentiment分析很新 . 如何判断给定的单词或句子是正面还是负面 . 我必须用java实现它 . 我试着阅读像lingpipe,rapidminer教程这样的东西,但我不明白 . 在他们的例子中,他们使用了大量数据 . 就我而言,我没有太多数据 . 我要说的只是一个单词或一个句子 . 我也尝试从stackoverflow中读取问题 . 但他们对我帮助不大 . 提前致谢 .
  • 0 votes
     answers
     views

    Twitter搜索词分析

    我正在尝试对大量推文进行一些单词分析 . 我正在根据搜索查询提取推文,然后我想以某种方式找到经常出现并与原始查询相关的关键字 . 我不太确定如何以合理有效的方式解决这个问题 . 我目前正在删除停用词,然后查找最常出现的词,但这比我想要的更基本 . 有没有人对这类事情有任何建议(甚至是关于该主题的任何阅读的链接)? 任何帮助非常感谢 . (我的实现是在Python中,如果这是相关的)
  • -1 votes
     answers
     views

    html5test.com如何工作,代码分析?

    我的老师想让我发表关于html5test.com的演讲 . 我知道这是一个关于浏览器如何支持html5的测试 . 我在github上获得了源代码,但我无法理解它 . 如何在我自己的代码编程中使用html5test?
  • 0 votes
     answers
     views

    情绪分析,特征选择[关闭]

    我想知道分析情绪的每个步骤的适当工具是什么:删除停用词,词干,文本的矢量表示,特征选择,分类,如何从文本的矢量表示传递到特征选择,是否有任何步骤可以遵循描述这些步骤的考试
  • 0 votes
     answers
     views

    开发情绪分析评分模型的代码问题

    我试图对twitter数据做一些情绪分析 . 我有一个字典(afinn_list),如下所示 好5 坏-5 太棒了6 我已经能够生成一个包含每个匹配单词位置的字符变量 . 现在我想生成一个得分变量,它将包含这些匹配的相应分数 . 我很难想出一个for循环逻辑 . class(afinn_list) [1]“data.frame” vPosMatches < - mat...
  • -2 votes
     answers
     views

    如何在csv文件上执行情绪分析

    我有一个包含注释的CSV文件,我将如何对此文件进行情绪分析?最好是希望使用python . 谢谢!
  • -1 votes
     answers
     views

    各种数据线的情感分析

    我是编程新手,还没有太多经验 . 我理解一些python代码,但没有详细说明 . 我有一个Excel文件,其中包含遇到问题的日志文件 . 问题的描述被粘贴为电子邮件(因此它是一堆文本) . 我想一次分析所有这些文本(Excel中几乎1.000行),我认为Python可以做到这一点 . 我想要做的分析类型是情绪分析(积极,中立,消极),或者我想看到文本中的主要问题 . 我不知道第二个是否可能 . 我...
  • 0 votes
     answers
     views

    twitter情绪分析curl :: curl_fetch_memory中的错误(url,handle = handle)

    我想分析推文 . 我正在使用此代码 . https://analytics4all.org/2016/11/25/r-twitter-sentiment-analysis/ 问题是当我执行这一行时:tweets = searchTwitter('Paris',n = 500) 我收到此错误:curl :: curl_fetch_memory(url,handle = handle)出错:无法连接...
  • 1 votes
     answers
     views

    使用OpenNLP在文本文件上进行情感分析

    我有100个测试数据句子 . 我试图对它们进行情绪分析,但无论我使用什么输入字符串,我只得到输入字符串的正面估计 . 每个句子的返回值为1.0 . 知道为什么会这样吗?即使我使用.txt文件中的负示例输入,结果也是正值 . public class StartSentiment { public static DoccatModel model = null; public static St...
  • 0 votes
     answers
     views

    使用命令行工具过滤和满足数据包流标准

    我有一个包含800万个数据包的pcap文件,我将其缩减为只有三个字段的txt文件:时间(以秒为单位),IP源地址,类型(流量) . 我需要从这个800万行文件中提取那些包含100个或更多数据包的IP地址,从而消除那些不符合100个数据包或更多标准的地址,从而使文件更小 . 但是我需要在减少的txt文件中保留所有3个字段和剩余地址(100个数据包)流中的所有数据包,因为我需要计算每个IP源地址的数据...
  • 2 votes
     answers
     views

    R聚类分析和具有相关矩阵的树形图

    我必须对大量数据执行聚类分析 . 由于我有很多缺失值,我做了一个相关矩阵 . corloads = cor(df1[,2:185], use = "pairwise.complete.obs") 现在我有问题怎么回事 . 我读了很多文章和例子,但没有什么对我有用 . 我怎样才能知道有多少簇对我有好处? 我已经尝试过了: dissimilarity = 1 - corloads...
  • 4 votes
     answers
     views

    Tiff分析仪

    我正在编写一个程序来转换一些数据,主要是一堆Tiff图像 . 一些Tiff似乎对他们有一个小问题 . 它们在一些 Spectator (Irfanview,客户的旧系统)中表现得很好,但在其他 Spectator 中却没有(客户的新系统,Window的图片和传真查看器) . 我手动查看了二进制数据,所有标签看起来都没问题 . 任何人都可以推荐一款可以分析它的应用程序并告诉我它有什么问题吗? 另外,...
  • 0 votes
     answers
     views

    R中的svm文件处理

    我有一个多标签分类问题 . 我在以下链接中提供了一个数据集:dataset 该数据集最初来自2007年的暹罗竞赛 . 该数据集包括描述某些航班中发生的问题的航空安全报告 . 这是一个多分类,高维度的问题 . 它有21519行和30438列 . 数据集包含.svm格式文件 . 我在R中的“read.delim”的帮助下阅读了文件 . 之后我得到了以下输出: 头(数据[,1])1 18 2:0.13...
  • 0 votes
     answers
     views

    R studio-面板数据回归分析

    我是R studio的新手,遇到了困难 . 我正在进行回归分析,试图解释政治稳定和经济自由如何影响国家的GDP增长 . 所以我有19个国家和10年2006 - 2015年的数据 . plm(formula = grwth ~ yrssch + gcf + ecofree + polstab + corpt, data = pdat, model = "fd") 当我运行...
  • 1 votes
     answers
     views

    二进制搜索运行时中的某些异常

    我有一个二进制搜索的修改版本,它以排序顺序和一个值接收一个数组,并返回一个等于或大于给定值的元素的最小可能索引(如果该值大于该值,则返回-1)最大) 运行上述算法后,一切正常,方法按预期工作 . 但是,我在不同的输入大小上运行它来测量运行时 . for(int i=1;i<=20;i++){ int size=10*(i*i*i*i); int[] array=createRand...
  • 2 votes
     answers
     views

    R,ggplot2中的密度图

    我试图使用R包ggplot2绘制并比较两组十进制数,介于0和1之间 . 当我在qplot中使用geom =“density”绘制时,我注意到密度曲线超过了1.0 . 我希望数据的密度图不超过集合的值范围,即所有区域都保持在0和1之间 . 是否可以绘制值0和1之间的密度,而不是超过1或0?如果是这样,我将如何做到这一点?我需要两个图的面积在0和1之间,即数据的范围 . 这是我用来生成图的代码 . 右...
  • 0 votes
     answers
     views

    facebook分析丢失事件

    我已经使用fb分析了一段时间,并发现在某些情况下会丢失事件: Bundle bundle = new Bundle(); bundle.putString(paramName, "xxx"); logger.logEvent(AppEventsConstants.EVENT_NAME_RATED, bundle); 当paramName只有一个字母时,SDK会创建一个事件来发...
  • 1 votes
     answers
     views

    BigData分析选择技术堆栈

    我想编写一个能够生成报告并通过监视来自大型 生产环境 系统的数据进行交互式数据分析(类似OLAP)的应用程序 . (我知道,未来会有一些有问题的权衡决定,但让我们暂时搁置它们 . )我确定了基本技术堆栈的以下可能性: Hadoop:用于分布式文件系统和MapReduce框架 数据库:HBase或Cassandra启用随机读取 分析:Hive或Pig进行高级分析 根据我的研究,我倾...
  • 0 votes
     answers
     views

    德鲁伊队列分析?

    我们会收集有关网站流量的数据,这样每天就会产生大约5万到10万次独立访问 . 队列分析: 查找24小时内在网站上注册然后实际进入我们的采购页面的用户百分比(计算在注册后的第一,第二,第三小时内有多少用户执行此操作的百分比) . 两个非常简短的示例文档: sessionId:执行计数的唯一标识符 url:评估同类群组的网址 time:事件的unix时间戳 {“sessionId”:“...
  • 0 votes
     answers
     views

    汽车Twitter情绪分析的工作代码

    针对代码以下汽车的Twitter情绪分析的工作代码也可用于对其他主题进行情绪分析 install. packages (c("devtools", "rjson", "bit64", "httr", "plyr", "ggplot2", "doBy", &qu...
  • 1 votes
     answers
     views

    Matlab互相关与相关系数问题

    我'm writing a program in C++ but using data from matlab involving Cross Correlation. I understand that when I do a correlation on 2 sets of data it gives me a single correlation coefficient number ind...
  • 2 votes
     answers
     views

    电脑音乐分析

    我试图分析mp3文件中的音乐 . 我想获得有关节奏,音高和其他音乐特征的信息 . 我怎样才能获得这些数据?是否有开源软件可以为我提供这些信息,甚至更好的图书馆? 任何人都可以给我一个关于做什么或从哪里开始寻找的提示?谢谢 .
  • 1 votes
     answers
     views

    如何在R中为manova准备数据

    文本中的数据如下所示: Initial Speed Pedal Rotation 10 mph 25 mph 40 mph 55 mph 5 degrees 0.35 0.19 0.14 0.10 8 degrees 0.37 0.28 0.19 0.19 10 degrees ...
  • 1 votes
     answers
     views

    R中的ANSVA在WRS2中:什么产生row.names错误?

    我试图在数据框 NewKDF (见下文)中运行 ANCOVA 包来自 COND = 2 组因子, HTAC =连续数值协变量和 BDD =连续因变量 . > head(NewKDF) #COND HTAC BDD #1 1 10 2 #2 2 10 6 #3 1 8 0 #4 1 15 2 #5 1 10 1 #6 ...
  • 0 votes
     answers
     views

    SQLite - 计算每个外键的记录数

    我需要一个查询来计算外键中未分配的主键 . 简而言之:当未出现在外键中时,计数值为0 . 见图: 我的查询仅返回已成为另一个表中的外键的主键的计数 . 我的查询未显示值0 . 我正在使用: SELECT l.name AS listName, COUNT(p.fk_list_identifier) AS countNum FROM list AS l INNER JOIN person...
  • 3 votes
     answers
     views

    统计相关性:Pearson还是Spearman?

    我在区间[0,1]中有2个系列的45个值 . 第一个系列是人类生成的标准,第二个系列是计算机生成的(全系列在这里http://www.copypastecode.com/74844/) . 第一个系列逐渐排序 . 0.909090909 0.216196598 0.909090909 0.111282099 0.9 0.021432587 0.9 0.033901106 ... 0.1 0.003...
  • 2 votes
     answers
     views

    用于数据分析的NoSQL或RDBMS

    我问自己是否应该尝试使用NoSQL数据库或SQL数据库 . 我已经阅读了很多,但是想听听一些有NoSQL经验的人 .我的情况如下:我们有一个不那么复杂的关系数据库模式 . 我们对推荐系统进行了重新研究,因此监控用户与特定门户网站的交互 . 我们后来想要分析收集的数据,以向用户显示他在门户网站上所做的工作,并根据他在门户网站上所做的工作生成建议 . 因为我们不需要进行大量的实验 . 但它会包含很多 ...

热门问题