学者信息

M<SUP>3</SUP>ixup: 3 ixup: A multi-modal data augmentation approach for image captioning

Pattern Recognition,0031-3203,2025-02.
Li, Yinan; Ji, Jiayi; Sun, Xiaoshuai; Zhou, Yiyi; Luo, Yunpeng; Ji, Rongrong
WOS:001312631400001 EI:20243617005938 10.1016/j.patcog.2024.110941
收录情况：SCIE、EI

Image Captioning via Dynamic Path Customization

IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS,2162-237X,2024-07-31.
Ma, Yiwei; Ji, Jiayi; Sun, Xiaoshuai; Zhou, Yiyi; Hong, Xiaopeng; Wu, Yongjian; Ji, Rongrong
WOS:001283798100001 EI:20251618247476 10.1109/TNNLS.2024.3409354
收录情况：SCIE、EI

ControlMLLM: Training-Free Visual Prompt Learning for Multimodal Large Language Models

arXiv,,2024-07-31.
Wu, Mingrui (1); Cai, Xinyue (1); Ji, Jiayi (1); Li, Jiale (1); Huang, Oucheng (1); Luo, Gen (1); F...
EI:20240344759 10.48550/arXiv.2407.21534
收录情况：EI

3D-GRES: Generalized 3D Referring Expression Segmentation

arXiv,,2024-07-30.
Wu, Changli (1); Liu, Yihang (1); Ji, Jiayi (1); Ma, Yiwei (1); Ding, Henghui (2); Wang, Haowei (3)...
EI:20240340934 10.48550/arXiv.2407.20664
收录情况：EI

Multi-branch Collaborative Learning Network for 3D Visual Grounding

arXiv,,2024-07-07.
Qian, Zhipeng (1); Ma, Yiwei (1); Lin, Zhekai (1); Ji, Jiayi (1); Zheng, Xiawu (1); Sun, Xiaoshuai ...
EI:20240298931 10.48550/arXiv.2407.05363
收录情况：EI

Exploring Phrase-Level Grounding with Text-to-Image Diffusion Model

arXiv,,2024-07-07.
Yang, Danni (1); Dong, Ruohan (1); Ji, Jiayi (1); Ma, Yiwei (1); Wang, Haowei (1, 2); Sun, Xiaoshua...
EI:20240300926 10.48550/arXiv.2407.05352
收录情况：EI

HRSAM: Efficiently Segment Anything in High-Resolution Images

arXiv,,2024-07-02.
Huang, You (1); Lai, Wenbin (1); Ji, Jiayi (1); Cao, Liujuan (1); Zhang, Shengchuan (1); Ji, Rongro...
EI:20240309017 10.48550/arXiv.2407.02109
收录情况：EI

Evaluating and Analyzing Relationship Hallucinations in LVLMs

arXiv,,2024-06-24.
Wu, Mingrui (1); Ji, Jiayi (1); Huang, Oucheng (1); Li, Jiale (1); Wu, Yuhang (1); Sun, Xiaoshuai (...
EI:20240278656 10.48550/arXiv.2406.16449
收录情况：EI

Beat: Bi-directional One-to-Many Embedding Alignment for Text-based Person Retrieval

arXiv,,2024-06-08.
Ma, Yiwei (1); Sun, Xiaoshuai (1); Ji, Jiayi (1); Jiang, Guannan (2); Zhuang, Weilin (2); Ji, Rongr...
EI:20240253801 10.48550/arXiv.2406.05620
收录情况：EI

SAM as the Guide: Mastering Pseudo-Label Refinement in Semi-Supervised Referring Expression Segmentation

arXiv,,2024-06-03.
Yang, Danni (1); Ji, Jiayi (1); Ma, Yiwei (1); Guo, Tianyu (1); Wang, Haowei (1, 2); Sun, Xiaoshuai...
EI:20240251392 10.48550/arXiv.2406.01451
收录情况：EI

Image Captioning via Dynamic Path Customization

arXiv,,2024-06-01.
Ma, Yiwei (1); Ji, Jiayi (1); Sun, Xiaoshuai (1); Zhou, Yiyi (1); Hong, Xiaopeng (2); Wu, Yongjian ...
EI:20240250266 10.48550/arXiv.2406.00334
收录情况：EI

X-Oscar: A Progressive Framework for High-quality Text-guided 3D Animatable Avatar Generation

arXiv,,2024-05-01.
Ma, Yiwei (1); Lin, Zhekai (1); Ji, Jiayi (1); Fan, Yijun (1); Sun, Xiaoshuai (1); Ji, Rongrong (1)
EI:20240203773 10.48550/arXiv.2405.00954
收录情况：EI

Toward Open-Set Human Object Interaction Detection

Proceedings of the AAAI Conference on Artificial Intelligence,2159-5399,2024-03-25.
Wu, Mingrui (1, 2); Liu, Yuqi (1); Ji, Jiayi (1); Sun, Xiaoshuai (1, 2); Ji, Rongrong (1, 2)
EI:20241515867323 10.1609/aaai.v38i6.28422
收录情况：EI

X-RefSeg3D: Enhancing Referring 3D Instance Segmentation via Structured Cross-Modal Graph Neural Networks

Proceedings of the AAAI Conference on Artificial Intelligence,2159-5399,2024-03-25.
Qian, Zhipeng (1); Ma, Yiwei (1); Ji, Jiayi (1); Sun, Xiaoshuai (1)
EI:20241515870575 10.1609/aaai.v38i5.28254
收录情况：EI

Improving Panoptic Narrative Grounding by Harnessing Semantic Relationships and Visual Confirmation

Proceedings of the AAAI Conference on Artificial Intelligence,2159-5399,2024-03-25.
Guo, Tianyu (1); Wang, Haowei (1); Ma, Yiwei (1); Ji, Jiayi (1); Sun, Xiaoshuai (1)
EI:20241515853906 10.1609/aaai.v38i3.27969
收录情况：EI

3D-STMN: Dependency-Driven Superpoint-Text Matching Network for End-to-End 3D Referring Expression Segmentation

Proceedings of the AAAI Conference on Artificial Intelligence,2159-5399,2024-03-25.
Wu, Changli (1); Ma, Yiwei (1); Chen, Qi (1); Wang, Haowei (1); Luo, Gen (1); Ji, Jiayi (1); Sun, X...
EI:20241515867515 10.1609/aaai.v38i6.28408
收录情况：EI

MMAPS: End-to-End Multi-Grained Multi-Modal Attribute-Aware Product Summarization

2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation, LREC-COLING 2024 - Main Conference Proceedings,,2024.
Chen, Tao (1); Lin, Ze (1); Li, Hui (1); Ji, Jiayi (1); Zhou, Yiyi (1); Li, Guanbin (2); Ji, Rongro...
EI:20242516269897
收录情况：EI

Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation

arXiv,,2023-12-19.
Liu, Sihan (1); Ma, Yiwei (1); Zhang, Xiaoqing (1); Wang, Haowei (1); Ji, Jiayi (1); Sun, Xiaoshuai...
EI:20230459507 10.48550/arXiv.2312.12470
收录情况：EI

X-Dreamer: Creating High-quality 3D Content by Bridging the Domain Gap Between Text-to-2D and Text-to-3D Generation

arXiv,,2023-11-30.
Ma, Yiwei (1); Fan, Yijun (1); Ji, Jiayi (1); Wang, Haowei (1); Sun, Xiaoshuai (1); Jiang, Guannan ...
EI:20230456530 10.48550/arXiv.2312.00085
收录情况：EI

Semi-Supervised Panoptic Narrative Grounding

arXiv,,2023-10-27.
Yang, Danni (1); Ji, Jiayi (1); Sun, Xiaoshuai (1); Wang, Haowei (1); Li, Yinan (1); Ma, Yiwei (1);...
EI:20230388009 10.48550/arXiv.2310.18142
收录情况：EI

Semi-Supervised Panoptic Narrative Grounding

MM 2023 - Proceedings of the 31st ACM International Conference on Multimedia,,2023-10-26.
Yang, Danni; Ji, Jiayi; Sun, Xiaoshuai; Wang, Haowei; Li, Yinan; Ma, Yiwei; Ji, Rongrong
WOS:001199449107017 EI:20235015224670 10.1145/3581783.3612259
收录情况：EI、CPCI-S

Beyond First Impressions: Integrating Joint Multi-modal Cues for Comprehensive 3D Representation

MM 2023 - Proceedings of the 31st ACM International Conference on Multimedia,,2023-10-26.
Wang, Haowei; Tang, Jiji; Ji, Jiayi; Sun, Xiaoshuai; Zhang, Rongsheng; Ma, Yiwei; Zhao, Minda; Li, ...
WOS:001199449103053 EI:20235015224377 10.1145/3581783.3611767
收录情况：EI、CPCI-S

JM3D & JM3D-LLM: Elevating 3D Representation with Joint Multi-modal Cues

arXiv,,2023-10-14.
Ji, Jiayi (1); Wang, Haowei (1); Wu, Changli (1); Ma, Yiwei (1); Sun, Xiaoshuai (1); Ji, Rongrong (...
EI:20230383428 10.48550/arXiv.2310.09503
收录情况：EI

3D-STMN: Dependency-Driven Superpoint-Text Matching Network for End-to-End 3D Referring Expression Segmentation

arXiv,,2023-08-31.
Wu, Changli (1); Ma, Yiwei (1); Chen, Qi (1); Wang, Haowei (1); Luo, Gen (1); Ji, Jiayi (1); Sun, X...
EI:20230325309 10.48550/arXiv.2308.16632
收录情况：EI

M3PS: End-to-End Multi-Grained Multi-Modal Attribute-Aware Product Summarization in E-commerce

arXiv,,2023-08-22.
Chen, Tao (1); Lin, Ze (1); Li, Hui (1); Ji, Jiayi (1); Zhou, Yiyi (1); Li, Guanbin (2); Ji, Rongro...
EI:20230303353 10.48550/arXiv.2308.11351
收录情况：EI

Beyond First Impressions: Integrating Joint Multi-modal Cues for Comprehensive 3D Representation

arXiv,,2023-08-05.
Wang, Haowei (1); Tang, Jiji (2); Ji, Jiayi (1); Sun, Xiaoshuai (1); Zhang, Rongsheng (2); Ma, Yiwe...
EI:20230296229 10.48550/arXiv.2308.02982
收录情况：EI

Towards Real-Time Panoptic Narrative Grounding by an End-to-End Grounding Network

Proceedings of the 37th AAAI Conference on Artificial Intelligence, AAAI 2023,,2023-06-27.
Wang, Haowei (1); Ji, Jiayi (1); Zhou, Yiyi (1, 2); Wu, Yongjian (4); Sun, Xiaoshuai (1, 2, 3)
EI:20233314551712
收录情况：EI

Towards local visual modeling for image captioning

Pattern Recognition,0031-3203,2023-06.
Ma, Yiwei; Ji, Jiayi; Sun, Xiaoshuai; Zhou, Yiyi; Ji, Rongrong
WOS:000942420500001 EI:20230713597890 10.1016/j.patcog.2023.109420
收录情况：SCIE、EI

X-Mesh: Towards Fast and Accurate Text-driven 3D Stylization via Dynamic Textual Guidance

arXiv,,2023-03-28.
Ma, Yiwei (1); Zhang, Xiaoqing (1); Sun, Xiaoshuai (1, 2); Ji, Jiayi (1); Wang, Haowei (1); Jiang, ...
EI:20230111116 10.48550/arXiv.2303.15764
收录情况：EI

Towards Local Visual Modeling for Image Captioning

arXiv,,2023-02-12.
Ma, Yiwei (1); Ji, Jiayi (1); Sun, Xiaoshuai (1, 2); Zhou, Yiyi (1); Ji, Rongrong (1, 2, 3)
EI:20230058187 10.48550/arXiv.2302.06098
收录情况：EI

Towards Real-Time Panoptic Narrative Grounding by an End-to-End Grounding Network

arXiv,,2023-01-08.
Wang, Haowei (1); Ji, Jiayi (1); Zhou, Yiyi (1, 2); Wu, Yongjian (4); Sun, Xiaoshuai (1, 2, 3)
EI:20230010575 10.48550/arXiv.2301.03160
收录情况：EI

X-Mesh: Towards Fast and Accurate Text-driven 3D Stylization via Dynamic Textual Guidance

Proceedings of the IEEE International Conference on Computer Vision,1550-5499,2023.
Ma, Yiwei; Zhang, Xiaoqing; Sun, Xiaoshuai; Ji, Jiayi; Wang, Haowei; Jiang, Guannan; Zhuang, Weilin...
WOS:001159644303001 EI:20240915636013 10.1109/ICCV51070.2023.00258
收录情况：EI、CPCI-S

Improving Image Captioning by Leveraging Intra- and Inter-layer Global Representation in Transformer Network

35th AAAI Conference on Artificial Intelligence, AAAI 2021,,2021.
Ji, Jiayi (1); Luo, Yunpeng (1); Sun, Xiaoshuai (1, 2); Chen, Fuhai (1); Luo, Gen (1); Wu, Yongjian...
EI:20222012114681
收录情况：EI

Dual-Level Collaborative Transformer for Image Captioning

35th AAAI Conference on Artificial Intelligence, AAAI 2021,,2021.
Luo, Yunpeng (1); Ji, Jiayi (1); Sun, Xiaoshuai (1); Cao, Liujuan (1); Wu, Yongjian (3); Huang, Fei...
EI:20222012116384
收录情况：EI

首页

学者

机构