NJU-LINK Lab

university

https://www.nju-link.com/

Activity Feed Request to join this org

AI & ML interests

None defined yet.

Recent Activity

lxpp updated a dataset about 18 hours ago

NJU-LINK/WebCompass

mistletoe111 updated a dataset 1 day ago

NJU-LINK/DR3-Eval

mistletoe111 authored a paper 1 day ago

MT-Video-Bench: A Holistic Video Understanding Benchmark for Evaluating Multimodal LLMs in Multi-Turn Dialogues

View all activity

Papers

DR$^{3}$-Eval: Towards Realistic and Reproducible Deep Research Evaluation

CodeTracer: Towards Traceable Agent States

View all Papers

lxpp

updated a dataset about 18 hours ago

NJU-LINK/WebCompass

Viewer • Updated about 18 hours ago • 933 • 1.85k • 3

updated a dataset 1 day ago

NJU-LINK/DR3-Eval

Viewer • Updated 1 day ago • 100 • 1.37k • 1

authored 3 papers 1 day ago

MT-Video-Bench: A Holistic Video Understanding Benchmark for Evaluating Multimodal LLMs in Multi-Turn Dialogues

Paper • 2510.17722 • Published Oct 20, 2025 • 20

IF-VidCap: Can Video Caption Models Follow Instructions?

Paper • 2510.18726 • Published Oct 21, 2025 • 26

DR$^{3}$-Eval: Towards Realistic and Reproducible Deep Research Evaluation

Paper • 2604.14683 • Published 6 days ago • 32

updated a dataset 3 days ago

NJU-LINK/WebCompass

Viewer • Updated about 18 hours ago • 933 • 1.85k • 3

updated a dataset 5 days ago

NJU-LINK/ViDiC-1K

Updated 11 days ago • 247 • 5

updated a dataset 5 days ago

NJU-LINK/DR3-Eval

Viewer • Updated 1 day ago • 100 • 1.37k • 1

authored a paper 5 days ago

Frontier-Eng: Benchmarking Self-Evolving Agents on Real-World Engineering Tasks with Generative Optimization

Paper • 2604.12290 • Published 8 days ago • 16

in NJU-LINK/CodeTraceBench 8 days ago

data: add manifests, reports, and dataset card

#2 opened 8 days ago by

data: add bench_artifacts batch 1/17

#3 opened 8 days ago by

updated a dataset 8 days ago

NJU-LINK/CodeTraceBench

Viewer • Updated 8 days ago • 4.32k • 4.02k • 2

in NJU-LINK/CodeTraceBench 8 days ago

test write access

#1 opened 8 days ago by

published a dataset 8 days ago

NJU-LINK/CodeTraceBench

Viewer • Updated 8 days ago • 4.32k • 4.02k • 2

authored a paper 8 days ago

CodeTracer: Towards Traceable Agent States

Paper • 2604.11641 • Published 9 days ago • 39

submitted a paper to Daily Papers 8 days ago

CodeTracer: Towards Traceable Agent States

Paper • 2604.11641 • Published 9 days ago • 39

updated a dataset 14 days ago

NJU-LINK/OmniVideoBench

Viewer • Updated 14 days ago • 1k • 2.32k • 4

lxpp

published a dataset 14 days ago

NJU-LINK/WebCompass

Viewer • Updated about 18 hours ago • 933 • 1.85k • 3

authored a paper 15 days ago

ContextBench: A Benchmark for Context Retrieval in Coding Agents

Paper • 2602.05892 • Published Feb 5 • 4

authored a paper 15 days ago

The Latent Space: Foundation, Evolution, Mechanism, Ability, and Outlook

Paper • 2604.02029 • Published 20 days ago • 143