首页 文章

立即停止Parallel.ForEach

提问于
浏览
2

我在每个循环停止并行时遇到问题 .

我正在迭代一组从表中检索到的大约40.000个DataRows,当我在结果集中有100个项目时,我需要立即停止循环 . 问题是当我在ParallelLoopState上触发Stop方法时,迭代不会立即停止,导致我的结果集不一致(无论是少数项还是多项) .

有没有办法确定,一旦我停止,我就会杀死所有线程?

List<DataRow> rows = new List<DataRow>(dataTable.Select());
  ConcurrentDictionary<string, object> resultSet = new ConcurrentDictionary<string, object>();

  rows.EachParallel(delegate (DataRow row, ParallelLoopState state)
  {
    if (!state.IsStopped)
    {
      using (SqlConnection sqlConnection = new SqlConnection(Global.ConnStr))
      {
        sqlConnection.Open();

        //{
        // Do some processing.......
        //}       

        var sourceKey = "key retrieved from processing";
        if (!resultSet.ContainsKey(sourceKey))
        {
          object myCustomObj = new object();

          resultSet.AddOrUpdate(
          sourceKey,
          myCustomObj,
          (key, oldValue) => myCustomObj);
        }

        if (resultSet.Values.Count == 100)
          state.Stop();
      }
    }
  });

1 回答

  • 6

    ParallelLoopState.Stop的文档页面解释了调用 Stop() 将阻止新的迭代启动 . 它不会中止任何现有的迭代 .

    Stop() 还将IsStopped属性设置为 true . 长时间运行的迭代可以检查 IsStopped 的值,并在需要时提前退出 .

    这称为协作取消,远比中止线程好 . 中止线程很昂贵并且难以清理 . 想象一下,如果你想提交你的工作时抛出 ThreadAbort 异常会发生什么 .

    另一方面,协作取消允许任务在必要时提交或中止事务后正常退出,关闭连接,清理其他状态和文件等 .

    此外, Parallel 使用任务而不是线程来处理数据块 . 其中一个线程是启动并行操作的原始线程 . 中止不仅会浪费线程池线程,它还会杀死主线程 .

    这不是一个错误 - Parallel 旨在解决数据并行问题,而不是异步执行 . 在这种情况下,需要系统使用尽可能多的任务来处理数据,并在处理完成后继续 .

相关问题