Deployed dd02692 with MkDocs version: 1.6.0

github-actions[bot] · github-actions[bot] · commit 3e107a223efe · 2024-07-13T15:41:31.000Z
diff --git a/index.html b/index.html
@@ -79,7 +79,7 @@
     <div data-md-component="skip">
       
         
-        <a href="#scicode-bench-how-good-are-lms-at-science" class="md-skip">
+        <a href="#scicode-a-research-coding-benchmark-curated-by-scientists" class="md-skip">
           Skip to content
         </a>
       
@@ -604,9 +604,21 @@
   
 
 
-<h1 id="scicode-bench-how-good-are-lms-at-science">Scicode-bench: How good are LMs at science?</h1>
-<p>Scicode-bench uses more than XX handcollected problem sets from various disciplines to evaluate the ability of LMs to solve any scientific challenge.</p>
-<p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. Aenean leo ligula.</p>
+<h1 id="scicode-a-research-coding-benchmark-curated-by-scientists">SciCode: A Research Coding Benchmark Curated by Scientists</h1>
+<h1 id="name-a-research-coding-benchmark-curated-by-scientists">\name: A Research Coding Benchmark Curated by Scientists</h1>
+<p><strong>Minyang Tian$^{1,2}$$^<em>$, Luyu Gao$^{3}$$^</em>$, Shizhuo Dylan Zhang$^{1}$, Xinan Chen$^{1}$$^\dagger$, Cunwei Fan$^{1}$$^\dagger$, Xuefei Guo$^{1}$$^\dagger$, Roland Haas$^{1}$$^\dagger$, Pan Ji$^{4}$$^\dagger$, Kittithat Krongchon$^{1}$$^\dagger$, Yao Li$^{1}$$^\dagger$, Shengyan Liu$^{1}$$^\dagger$, Di Luo$^{5,6,11}$$^\dagger$, Yutao Ma$^{7}$$^\dagger$, Hao Tong$^{1}$$^\dagger$, Kha Trinh$^{7}$$^\dagger$, Chenyu Tian$^{8}$$^\dagger$, Zihan Wang$^{1}$$^\dagger$, Bohao Wu$^{1}$$^\dagger$, Yanyu Xiong$^{9}$$^\dagger$, Shengzhu Yin$^{1}$$^\dagger$, Minhui Zhu$^{1}$$^\dagger$, Kilian Lieret$^{10}$, Yanxin Lu$^{1}$, Genglin Liu$^{1}$, Yufeng Du$^{1}$, Tianhua Tao$^{1}$, Ofir Press$^{10}$, Jamie Callan$^{3}$, Eliu Huerta$^{1,2,7}$, Hao Peng$^{1}$</strong></p>
+<p>$^{1}$University of Illinois Urbana-Champaign <br />
+$^{2}$Argonne National Laboratory<br />
+$^{3}$Carnegie Mellon University<br />
+$^{4}$University of North Carolina at Chapel Hill<br />
+$^{5}$Massachusetts Institute of Technology<br />
+$^{6}$Harvard University<br />
+$^{7}$University of Chicago<br />
+$^{8}$University of Texas at Austin<br />
+$^{9}$Stanford University<br />
+$^{10}$Princeton University<br />
+$^{11}$The NSF AI Institute for Artificial Intelligence and Fundamental Interactions  </p>
+<p>$^{*}$ Equal contribution lead authors. $^\dagger$ Data curation, alphabetical order.</p>
 <div class="grid cards">
 <ul>
 <li>
diff --git a/search/search_index.json b/search/search_index.json
@@ -1 +1 @@
-{"config":{"lang":["en"],"separator":"[\\s\\-]+","pipeline":["stopWordFilter"]},"docs":[{"location":"","title":"Scicode-bench: How good are LMs at science?","text":"<p>Scicode-bench uses more than XX handcollected problem sets from various disciplines to evaluate the ability of LMs to solve any scientific challenge.</p> <p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. Aenean leo ligula.</p> <ul> <li> <p> Leaderboard</p> <p>How good are LMs at science, really?</p> <p> Browse the results</p> </li> <li> <p> Preprint</p> <p>Learn all the details</p> <p> Read the preprint</p> </li> </ul> <p>commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. </p> <p>Aenean leo ligula, porttitor eu, consequat vitae, eleifend ac, enim. Aliquam lorem ante, dapibus in, viverra quis, feugiat a, tellus. Phasellus viverra nulla ut metus varius laoreet. Quisque rutrum. Aenean imperdiet. Etiam ultricies nisi vel augue. Curabitur ullamcorper ultricies nisi. Nam eget dui. Etiam rhoncus. Maecenas tempus, tellus eget condimentum rhoncus, sem quam semper libero, sit amet adipiscing sem neque sed ipsum. Nam quam nunc, blandit vel, luctus pulvinar, hendrerit id, lorem. Maecenas nec odio et ante tincidunt tempus. Donec vitae sapien ut libero venenatis faucibus. Nullam quis ante. Etiam sit amet orci eget eros faucibus tincidunt. Duis leo. Sed fringilla mauris sit amet nibh. Donec sodales sagittis magna. Sed consequat, leo eget bibendum sodales, augue velit cursus nunc.</p> <ul> <li> <p> Installation &amp; usage</p> <p>Learn how to evaluate your model</p> <p> Read the docs</p> </li> </ul>"},{"location":"_footer/","title":"footer","text":"<ul> <li> <p> Something broken?  Report bug</p> </li> <li> <p> Something unclear?  Ask question</p> </li> </ul>"},{"location":"leaderboard/","title":"Leaderboard","text":"<p> date author model score 240712 scicode gpt4 0.8 240712 scicode gpt4o 0.8 <p></p> <p>How to submit</p> <p>Want to submit your own model? Head over to the documentation.</p>"},{"location":"leaderboard_table/","title":"Leaderboard table","text":"date author model score 240712 scicode gpt4 0.8 240712 scicode gpt4o 0.8"}]}
+{"config":{"lang":["en"],"separator":"[\\s\\-]+","pipeline":["stopWordFilter"]},"docs":[{"location":"","title":"SciCode: A Research Coding Benchmark Curated by Scientists","text":""},{"location":"#name-a-research-coding-benchmark-curated-by-scientists","title":"\\name: A Research Coding Benchmark Curated by Scientists","text":"<p>Minyang Tian$^{1,2}$$^$, Luyu Gao$^{3}$$^$, Shizhuo Dylan Zhang$^{1}$, Xinan Chen$^{1}$$^\\dagger$, Cunwei Fan$^{1}$$^\\dagger$, Xuefei Guo$^{1}$$^\\dagger$, Roland Haas$^{1}$$^\\dagger$, Pan Ji$^{4}$$^\\dagger$, Kittithat Krongchon$^{1}$$^\\dagger$, Yao Li$^{1}$$^\\dagger$, Shengyan Liu$^{1}$$^\\dagger$, Di Luo$^{5,6,11}$$^\\dagger$, Yutao Ma$^{7}$$^\\dagger$, Hao Tong$^{1}$$^\\dagger$, Kha Trinh$^{7}$$^\\dagger$, Chenyu Tian$^{8}$$^\\dagger$, Zihan Wang$^{1}$$^\\dagger$, Bohao Wu$^{1}$$^\\dagger$, Yanyu Xiong$^{9}$$^\\dagger$, Shengzhu Yin$^{1}$$^\\dagger$, Minhui Zhu$^{1}$$^\\dagger$, Kilian Lieret$^{10}$, Yanxin Lu$^{1}$, Genglin Liu$^{1}$, Yufeng Du$^{1}$, Tianhua Tao$^{1}$, Ofir Press$^{10}$, Jamie Callan$^{3}$, Eliu Huerta$^{1,2,7}$, Hao Peng$^{1}$</p> <p>$^{1}$University of Illinois Urbana-Champaign  $^{2}$Argonne National Laboratory $^{3}$Carnegie Mellon University $^{4}$University of North Carolina at Chapel Hill $^{5}$Massachusetts Institute of Technology $^{6}$Harvard University $^{7}$University of Chicago $^{8}$University of Texas at Austin $^{9}$Stanford University $^{10}$Princeton University $^{11}$The NSF AI Institute for Artificial Intelligence and Fundamental Interactions  </p> <p>$^{*}$ Equal contribution lead authors. $^\\dagger$ Data curation, alphabetical order.</p> <ul> <li> <p> Leaderboard</p> <p>How good are LMs at science, really?</p> <p> Browse the results</p> </li> <li> <p> Preprint</p> <p>Learn all the details</p> <p> Read the preprint</p> </li> </ul> <p>commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. </p> <p>Aenean leo ligula, porttitor eu, consequat vitae, eleifend ac, enim. Aliquam lorem ante, dapibus in, viverra quis, feugiat a, tellus. Phasellus viverra nulla ut metus varius laoreet. Quisque rutrum. Aenean imperdiet. Etiam ultricies nisi vel augue. Curabitur ullamcorper ultricies nisi. Nam eget dui. Etiam rhoncus. Maecenas tempus, tellus eget condimentum rhoncus, sem quam semper libero, sit amet adipiscing sem neque sed ipsum. Nam quam nunc, blandit vel, luctus pulvinar, hendrerit id, lorem. Maecenas nec odio et ante tincidunt tempus. Donec vitae sapien ut libero venenatis faucibus. Nullam quis ante. Etiam sit amet orci eget eros faucibus tincidunt. Duis leo. Sed fringilla mauris sit amet nibh. Donec sodales sagittis magna. Sed consequat, leo eget bibendum sodales, augue velit cursus nunc.</p> <ul> <li> <p> Installation &amp; usage</p> <p>Learn how to evaluate your model</p> <p> Read the docs</p> </li> </ul>"},{"location":"_footer/","title":"footer","text":"<ul> <li> <p> Something broken?  Report bug</p> </li> <li> <p> Something unclear?  Ask question</p> </li> </ul>"},{"location":"leaderboard/","title":"Leaderboard","text":"<p> date author model score 240712 scicode gpt4 0.8 240712 scicode gpt4o 0.8 <p></p> <p>How to submit</p> <p>Want to submit your own model? Head over to the documentation.</p>"},{"location":"leaderboard_table/","title":"Leaderboard table","text":"date author model score 240712 scicode gpt4 0.8 240712 scicode gpt4o 0.8"}]}
diff --git a/sitemap.xml.gz b/sitemap.xml.gz

Original file line number	Diff line number	Diff line change
`@@ -1 +1 @@`
`1`		-{"config":{"lang":["en"],"separator":"[\\s\\-]+","pipeline":["stopWordFilter"]},"docs":[{"location":"","title":"Scicode-bench: How good are LMs at science?","text":"<p>Scicode-bench uses more than XX handcollected problem sets from various disciplines to evaluate the ability of LMs to solve any scientific challenge.</p> <p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. Aenean leo ligula.</p> <ul> <li> <p> Leaderboard</p> <p>How good are LMs at science, really?</p> <p> Browse the results</p> </li> <li> <p> Preprint</p> <p>Learn all the details</p> <p> Read the preprint</p> </li> </ul> <p>commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. </p> <p>Aenean leo ligula, porttitor eu, consequat vitae, eleifend ac, enim. Aliquam lorem ante, dapibus in, viverra quis, feugiat a, tellus. Phasellus viverra nulla ut metus varius laoreet. Quisque rutrum. Aenean imperdiet. Etiam ultricies nisi vel augue. Curabitur ullamcorper ultricies nisi. Nam eget dui. Etiam rhoncus. Maecenas tempus, tellus eget condimentum rhoncus, sem quam semper libero, sit amet adipiscing sem neque sed ipsum. Nam quam nunc, blandit vel, luctus pulvinar, hendrerit id, lorem. Maecenas nec odio et ante tincidunt tempus. Donec vitae sapien ut libero venenatis faucibus. Nullam quis ante. Etiam sit amet orci eget eros faucibus tincidunt. Duis leo. Sed fringilla mauris sit amet nibh. Donec sodales sagittis magna. Sed consequat, leo eget bibendum sodales, augue velit cursus nunc.</p> <ul> <li> <p> Installation & usage</p> <p>Learn how to evaluate your model</p> <p> Read the docs</p> </li> </ul>"},{"location":"_footer/","title":"footer","text":"<ul> <li> <p> Something broken? Report bug</p> </li> <li> <p> Something unclear? Ask question</p> </li> </ul>"},{"location":"leaderboard/","title":"Leaderboard","text":"<p> date author model score 240712 scicode gpt4 0.8 240712 scicode gpt4o 0.8 <p></p> <p>How to submit</p> <p>Want to submit your own model? Head over to the documentation.</p>"},{"location":"leaderboard_table/","title":"Leaderboard table","text":"date author model score 240712 scicode gpt4 0.8 240712 scicode gpt4o 0.8"}]}
	`1`	+{"config":{"lang":["en"],"separator":"[\\s\\-]+","pipeline":["stopWordFilter"]},"docs":[{"location":"","title":"SciCode: A Research Coding Benchmark Curated by Scientists","text":""},{"location":"#name-a-research-coding-benchmark-curated-by-scientists","title":"\\name: A Research Coding Benchmark Curated by Scientists","text":"<p>Minyang Tian$^{1,2}$$^$, Luyu Gao$^{3}$$^$, Shizhuo Dylan Zhang$^{1}$, Xinan Chen$^{1}$$^\\dagger$, Cunwei Fan$^{1}$$^\\dagger$, Xuefei Guo$^{1}$$^\\dagger$, Roland Haas$^{1}$$^\\dagger$, Pan Ji$^{4}$$^\\dagger$, Kittithat Krongchon$^{1}$$^\\dagger$, Yao Li$^{1}$$^\\dagger$, Shengyan Liu$^{1}$$^\\dagger$, Di Luo$^{5,6,11}$$^\\dagger$, Yutao Ma$^{7}$$^\\dagger$, Hao Tong$^{1}$$^\\dagger$, Kha Trinh$^{7}$$^\\dagger$, Chenyu Tian$^{8}$$^\\dagger$, Zihan Wang$^{1}$$^\\dagger$, Bohao Wu$^{1}$$^\\dagger$, Yanyu Xiong$^{9}$$^\\dagger$, Shengzhu Yin$^{1}$$^\\dagger$, Minhui Zhu$^{1}$$^\\dagger$, Kilian Lieret$^{10}$, Yanxin Lu$^{1}$, Genglin Liu$^{1}$, Yufeng Du$^{1}$, Tianhua Tao$^{1}$, Ofir Press$^{10}$, Jamie Callan$^{3}$, Eliu Huerta$^{1,2,7}$, Hao Peng$^{1}$</p> <p>$^{1}$University of Illinois Urbana-Champaign $^{2}$Argonne National Laboratory $^{3}$Carnegie Mellon University $^{4}$University of North Carolina at Chapel Hill $^{5}$Massachusetts Institute of Technology $^{6}$Harvard University $^{7}$University of Chicago $^{8}$University of Texas at Austin $^{9}$Stanford University $^{10}$Princeton University $^{11}$The NSF AI Institute for Artificial Intelligence and Fundamental Interactions </p> <p>$^{*}$ Equal contribution lead authors. $^\\dagger$ Data curation, alphabetical order.</p> <ul> <li> <p> Leaderboard</p> <p>How good are LMs at science, really?</p> <p> Browse the results</p> </li> <li> <p> Preprint</p> <p>Learn all the details</p> <p> Read the preprint</p> </li> </ul> <p>commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In enim justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Integer tincidunt. Cras dapibus. Vivamus elementum semper nisi. Aenean vulputate eleifend tellus. </p> <p>Aenean leo ligula, porttitor eu, consequat vitae, eleifend ac, enim. Aliquam lorem ante, dapibus in, viverra quis, feugiat a, tellus. Phasellus viverra nulla ut metus varius laoreet. Quisque rutrum. Aenean imperdiet. Etiam ultricies nisi vel augue. Curabitur ullamcorper ultricies nisi. Nam eget dui. Etiam rhoncus. Maecenas tempus, tellus eget condimentum rhoncus, sem quam semper libero, sit amet adipiscing sem neque sed ipsum. Nam quam nunc, blandit vel, luctus pulvinar, hendrerit id, lorem. Maecenas nec odio et ante tincidunt tempus. Donec vitae sapien ut libero venenatis faucibus. Nullam quis ante. Etiam sit amet orci eget eros faucibus tincidunt. Duis leo. Sed fringilla mauris sit amet nibh. Donec sodales sagittis magna. Sed consequat, leo eget bibendum sodales, augue velit cursus nunc.</p> <ul> <li> <p> Installation & usage</p> <p>Learn how to evaluate your model</p> <p> Read the docs</p> </li> </ul>"},{"location":"_footer/","title":"footer","text":"<ul> <li> <p> Something broken? Report bug</p> </li> <li> <p> Something unclear? Ask question</p> </li> </ul>"},{"location":"leaderboard/","title":"Leaderboard","text":"<p> date author model score 240712 scicode gpt4 0.8 240712 scicode gpt4o 0.8 <p></p> <p>How to submit</p> <p>Want to submit your own model? Head over to the documentation.</p>"},{"location":"leaderboard_table/","title":"Leaderboard table","text":"date author model score 240712 scicode gpt4 0.8 240712 scicode gpt4o 0.8"}]}