开启辅助访问
 找回密码
 立即注册

使用P3D(pseudo-3d)进行视频场景的分类

zero263 回答数15 浏览数547004
第五季. | 未知
懂了,谢谢您~
回复
使用道具 举报
sRGFCZAg | 未知
是的,已经改正
用Deepseek满血版问问看
回复
使用道具 举报
CpahmDLO | 未知
博主你好,感谢你的分享,我按照你的博客遇到如下两个问题: 1. 当我用C3D的c3d_ucf101_finetuning中的train.lst进行训练时,总是有这个错: Check failed: end_frm <= num_of_frames (209 vs. 208) end frame must be less or equal to num of frames。我把每个视频的最后一个数据片段删掉了之后,就不报这个错了,这是正常的吗?这个是我的数据层:
layer {
  name: "data"
  type: "VideoData"
  top: "data"
  top: "label"
  include {
    phase: TRAIN
  }
  transform_param {
    crop_size: 160
    mean_value: 128
    mirror: true
  }
  video_data_param {
    source: "train_01_video_1.txt"
    root_folder: "/data/lijiahao/action_recognition_datasets/UCF101/UCF-101/"
    new_length: 8
    sampling_rate: 2
    new_height: 182
    new_width: 242
    use_image: false
    show_data: false
    batch_size: 10
    shuffle: true
  }
}
2. 另外一个问题:用上述数据开始训练后,准确率只能达到82%,不管我怎么调整学习率,都很难达到更高的准确率,请问你知道这是怎么回事吗?
谢谢!
回复
使用道具 举报
aipipi | 未知
video input layer的c++代码有bug,目前你就用图片作为输入来绕过
回复
使用道具 举报
skypaladin | 未知
那准确率呢?是不是还有什么trick要注意呢,我训练的结果在测试集上没有达到论文的精度。你是训练了多少步达到93%的呢,学习率设置为多少呢?我这边训练了20000步,感觉已经收敛了:
I0523 22:02:37.496280 27583 solver.cpp:331] Iteration 19000, Testing net (#0)
I0523 22:05:48.181365 27583 solver.cpp:398]     Test net output #0: accuracy/top-1 = 0.989
I0523 22:05:48.181493 27583 solver.cpp:398]     Test net output #1: accuracy/top-5 = 1
I0523 22:05:48.181515 27583 solver.cpp:398]     Test net output #2: loss = 0.02963 (* 1 = 0.02963 loss)
I0523 22:05:48.181527 27583 solver.cpp:331] Iteration 19000, Testing net (#1)
I0523 22:05:50.998272 27583 blocking_queue.cpp:49] Waiting for data
I0523 22:08:31.145496 27583 solver.cpp:398]     Test net output #0: accuracy/top-1 = 0.844
I0523 22:08:31.145651 27583 solver.cpp:398]     Test net output #1: accuracy/top-5 = 0.965
I0523 22:08:31.145689 27583 solver.cpp:398]     Test net output #2: loss = 0.662011 (* 1 = 0.662011 loss)
多谢博主!
回复
使用道具 举报
own | 未知
请问您复现出来了吗,我的也是迭代20000次只有82%的accuracy..上不去了
回复
使用道具 举报
12
快速回复
您需要登录后才可以回帖 登录 | 立即注册

当贝投影