Ruiqi Zhang

Citat de

	Toate	Din 2019
Referințe bibliografice	150	150
h-index	5	5
i10-index	3	3

100

2022202320248 50 92

Acces public

Afișați-le pe toate

2 articole

0 articole

disponibile

indisponibile

Pe baza cerințelor privind finanțarea

Coautori

Peter BartlettProfessor, EECS and Statistics, UC BerkeleyAdresă de e-mail confirmată pe cs.berkeley.edu
Spencer FreiUC DavisAdresă de e-mail confirmată pe ucdavis.edu
Mengdi WangCenter for Statistics & Machine Learning, ECE, Princeton UniversityAdresă de e-mail confirmată pe princeton.edu
Xuezhou ZhangBoston UniversityAdresă de e-mail confirmată pe bu.edu
Chengzhuo NiPrinceton UniversityAdresă de e-mail confirmată pe alumni.princeton.edu
Andrea ZanetteAssistant Professor, Carnegie Mellon UniversityAdresă de e-mail confirmată pe andrew.cmu.edu
Licong LinPhD student at UC BerkeleyAdresă de e-mail confirmată pe berkeley.edu
Song MeiAssistant Professor at UC BerkeleyAdresă de e-mail confirmată pe berkeley.edu
Yu BaiOpenAIAdresă de e-mail confirmată pe salesforce.com
Xiang JiPrinceton UniversityAdresă de e-mail confirmată pe princeton.edu
Zhaorun ChenPh.D. Student, UChicago CSAdresă de e-mail confirmată pe uchicago.edu
Zhuokai ZhaoResearch Scientist, Meta AIAdresă de e-mail confirmată pe uchicago.edu
Huaxiu YaoAssistant Professor of Computer Science and Data Science, UNC Chapel HillAdresă de e-mail confirmată pe cs.unc.edu
Bhiksha RajCarnegie Mellon UniversityAdresă de e-mail confirmată pe cs.cmu.edu
Xiang LiCarnegie Mellon UniversityAdresă de e-mail confirmată pe andrew.cmu.edu
Jingfeng WuUniversity of California, BerkeleyAdresă de e-mail confirmată pe berkeley.edu
Yuexiang ZhaiUC BerkeleyAdresă de e-mail confirmată pe berkeley.edu
Jiahao QiuPrinceton UniversityAdresă de e-mail confirmată pe princeton.edu

Urmăriți

Ruiqi Zhang

Ph.D. Student, Statistics Department at University of California, Berkeley

Adresă de e-mail confirmată pe berkeley.edu - Pagina de pornire

Statistical Machine Learning Deep Learning Theory LLM Alignment Sequential Decision Making


Titlu Sortați după descrierea bibliografică Sortați după an Sortați după titlu	Citat de Citat de	Anul
Trained transformers learn linear models in-context R Zhang, S Frei, PL Bartlett Journal of Machine Learning Research 25 (49), 1-55, 2024	98	2024
Off-policy fitted q-evaluation with differentiable function approximators: Z-estimation and inference theory R Zhang, X Zhang, C Ni, M Wang International Conference on Machine Learning, 26713-26749, 2022	18	2022
Negative preference optimization: From catastrophic collapse to effective unlearning R Zhang, L Lin, Y Bai, S Mei The First Conference of Language Models (COLM) in 2024, 2024	17	2024
AutoPRM: Automating Procedural Supervision for Multi-Step Reasoning via Controllable Question Decomposition Z Chen, Z Zhao, Z Zhu, R Zhang, X Li, B Raj, H Yao NAACL 2024, 2024	5	2024
Optimal estimation of policy gradient via double fitted iteration C Ni, R Zhang, X Ji, X Zhang, M Wang International Conference on Machine Learning, 16724-16783, 2022	5*	2022
Policy Finetuning in Reinforcement Learning via Design of Experiments using Offline Data R Zhang, A Zanette Advances in Neural Information Processing Systems, 2024, 2023	4	2023
In-context learning of a linear Transformer block: benefits of the MLP component and one-step GD initialization R Zhang, J Wu, PL Bartlett arXiv preprint arXiv:2402.14951, 2024	3	2024
Is Offline Decision Making Possible with Only Few Samples? Reliable Decisions in Data-Starved Bandits via Trust Region Enhancement R Zhang, Y Zhai, A Zanette arXiv preprint arXiv:2402.15703, 2024		2024
Accelerating Best-of-N via Speculative Rejection R Zhang, M Haider, M Yin, J Qiu, M Wang, P Bartlett, A Zanette 2nd Workshop on Advancing Neural Network Training: Computational Efficiency …, 0

Sistemul nu poate realiza operația în acest moment. Încercați din nou mai târziu.

Articole 1–9

Referințe bibliografice pe an

Citate duplicat

Citate fuzionate

Adăugați coautoriCoautori

Urmăriți

Citat de

Coautori