raznem
diff --git a/‎features/custom-models/index.html‎
Lines changed: 24 additions & 25 deletions b/‎features/custom-models/index.html‎
Lines changed: 24 additions & 25 deletions
diff --git a/‎search/search_index.json‎
Lines changed: 1 addition & 1 deletion b/‎search/search_index.json‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎sitemap.xml‎
Lines changed: 15 additions & 15 deletions b/‎sitemap.xml‎
Lines changed: 15 additions & 15 deletions
diff --git a/‎sitemap.xml.gz‎
1 Byte b/‎sitemap.xml.gz‎
1 Byte
@@ -76,7 +76,7 @@
     <div data-md-component="skip">
 
 
-        <a href="#run-custom-langchain-openai-model" class="md-skip">
+        <a href="#run-custom-model" class="md-skip">
           Skip to content
         </a>
 
@@ -435,9 +435,9 @@
     <ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
 
         <li class="md-nav__item">
-  <a href="#run-custom-langchain-openai-model" class="md-nav__link">
+  <a href="#run-custom-model" class="md-nav__link">
     <span class="md-ellipsis">
-      Run custom langchain OpenAI model
+      Run custom model
     </span>
   </a>
 
@@ -732,9 +732,9 @@
     <ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
 
         <li class="md-nav__item">
-  <a href="#run-custom-langchain-openai-model" class="md-nav__link">
+  <a href="#run-custom-model" class="md-nav__link">
     <span class="md-ellipsis">
-      Run custom langchain OpenAI model
+      Run custom model
     </span>
   </a>
 
@@ -778,28 +778,27 @@
 
   <h1>Custom models</h1>
 
-<p>Note that small local models tend to trim long outputs and could require more careful tuning of data description. </p>
-<h2 id="run-custom-langchain-openai-model">Run custom langchain OpenAI model</h2>
-<p>You can instantiate <code>Parsera</code> with any chat model supported by LangChain, for example, to run the model from Azure:<br />
+<p>All custom models are run with <a href="/features/extractors/#chunks-tabular-extractor"><code>ChunksTabularExtractor</code></a>,
+if you want custom extractor you need to initialize it with model of your choice.</p>
+<p>Note that small local models tend to trim long outputs and could require more careful tuning of data description.</p>
+<h2 id="run-custom-model">Run custom model</h2>
+<p>You can instantiate <code>Parsera</code> with any chat model supported by LangChain, for example, to run <code>gpt-4o-mini</code> from OpenAI API:<br />
 <div class="language-python highlight"><pre><span></span><code><span id="__span-0-1"><a id="__codelineno-0-1" name="__codelineno-0-1" href="#__codelineno-0-1"></a><span class="kn">import</span><span class="w"> </span><span class="nn">os</span>
-</span><span id="__span-0-2"><a id="__codelineno-0-2" name="__codelineno-0-2" href="#__codelineno-0-2"></a><span class="kn">from</span><span class="w"> </span><span class="nn">langchain_openai</span><span class="w"> </span><span class="kn">import</span> <span class="n">AzureChatOpenAI</span>
+</span><span id="__span-0-2"><a id="__codelineno-0-2" name="__codelineno-0-2" href="#__codelineno-0-2"></a><span class="kn">from</span><span class="w"> </span><span class="nn">langchain_openai</span><span class="w"> </span><span class="kn">import</span> <span class="n">ChatOpenAI</span>
 </span><span id="__span-0-3"><a id="__codelineno-0-3" name="__codelineno-0-3" href="#__codelineno-0-3"></a>
-</span><span id="__span-0-4"><a id="__codelineno-0-4" name="__codelineno-0-4" href="#__codelineno-0-4"></a><span class="n">llm</span> <span class="o">=</span> <span class="n">AzureChatOpenAI</span><span class="p">(</span>
-</span><span id="__span-0-5"><a id="__codelineno-0-5" name="__codelineno-0-5" href="#__codelineno-0-5"></a>    <span class="n">azure_endpoint</span><span class="o">=</span><span class="n">os</span><span class="o">.</span><span class="n">getenv</span><span class="p">(</span><span class="s2">&quot;AZURE_GPT_BASE_URL&quot;</span><span class="p">),</span>
-</span><span id="__span-0-6"><a id="__codelineno-0-6" name="__codelineno-0-6" href="#__codelineno-0-6"></a>    <span class="n">openai_api_version</span><span class="o">=</span><span class="s2">&quot;2023-05-15&quot;</span><span class="p">,</span>
-</span><span id="__span-0-7"><a id="__codelineno-0-7" name="__codelineno-0-7" href="#__codelineno-0-7"></a>    <span class="n">deployment_name</span><span class="o">=</span><span class="n">os</span><span class="o">.</span><span class="n">getenv</span><span class="p">(</span><span class="s2">&quot;AZURE_GPT_DEPLOYMENT_NAME&quot;</span><span class="p">),</span>
-</span><span id="__span-0-8"><a id="__codelineno-0-8" name="__codelineno-0-8" href="#__codelineno-0-8"></a>    <span class="n">openai_api_key</span><span class="o">=</span><span class="n">os</span><span class="o">.</span><span class="n">getenv</span><span class="p">(</span><span class="s2">&quot;AZURE_GPT_API_KEY&quot;</span><span class="p">),</span>
-</span><span id="__span-0-9"><a id="__codelineno-0-9" name="__codelineno-0-9" href="#__codelineno-0-9"></a>    <span class="n">openai_api_type</span><span class="o">=</span><span class="s2">&quot;azure&quot;</span><span class="p">,</span>
-</span><span id="__span-0-10"><a id="__codelineno-0-10" name="__codelineno-0-10" href="#__codelineno-0-10"></a>    <span class="n">temperature</span><span class="o">=</span><span class="mf">0.0</span><span class="p">,</span>
-</span><span id="__span-0-11"><a id="__codelineno-0-11" name="__codelineno-0-11" href="#__codelineno-0-11"></a><span class="p">)</span>
-</span><span id="__span-0-12"><a id="__codelineno-0-12" name="__codelineno-0-12" href="#__codelineno-0-12"></a>
-</span><span id="__span-0-13"><a id="__codelineno-0-13" name="__codelineno-0-13" href="#__codelineno-0-13"></a><span class="n">url</span> <span class="o">=</span> <span class="s2">&quot;https://github.com/raznem/parsera&quot;</span>
-</span><span id="__span-0-14"><a id="__codelineno-0-14" name="__codelineno-0-14" href="#__codelineno-0-14"></a><span class="n">elements</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-15"><a id="__codelineno-0-15" name="__codelineno-0-15" href="#__codelineno-0-15"></a>    <span class="s2">&quot;Stars&quot;</span><span class="p">:</span> <span class="s2">&quot;Number of stars&quot;</span><span class="p">,</span>
-</span><span id="__span-0-16"><a id="__codelineno-0-16" name="__codelineno-0-16" href="#__codelineno-0-16"></a>    <span class="s2">&quot;Fork&quot;</span><span class="p">:</span> <span class="s2">&quot;Number of forks&quot;</span><span class="p">,</span>
-</span><span id="__span-0-17"><a id="__codelineno-0-17" name="__codelineno-0-17" href="#__codelineno-0-17"></a><span class="p">}</span>
-</span><span id="__span-0-18"><a id="__codelineno-0-18" name="__codelineno-0-18" href="#__codelineno-0-18"></a><span class="n">scrapper</span> <span class="o">=</span> <span class="n">Parsera</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="n">llm</span><span class="p">)</span>
-</span><span id="__span-0-19"><a id="__codelineno-0-19" name="__codelineno-0-19" href="#__codelineno-0-19"></a><span class="n">result</span> <span class="o">=</span> <span class="n">scrapper</span><span class="o">.</span><span class="n">run</span><span class="p">(</span><span class="n">url</span><span class="o">=</span><span class="n">url</span><span class="p">,</span> <span class="n">elements</span><span class="o">=</span><span class="n">elements</span><span class="p">)</span>
+</span><span id="__span-0-4"><a id="__codelineno-0-4" name="__codelineno-0-4" href="#__codelineno-0-4"></a><span class="n">llm</span> <span class="o">=</span> <span class="n">ChatOpenAI</span><span class="p">(</span>
+</span><span id="__span-0-5"><a id="__codelineno-0-5" name="__codelineno-0-5" href="#__codelineno-0-5"></a>    <span class="n">model</span><span class="o">=</span><span class="s2">&quot;gpt-4o-mini&quot;</span><span class="p">,</span>
+</span><span id="__span-0-6"><a id="__codelineno-0-6" name="__codelineno-0-6" href="#__codelineno-0-6"></a>    <span class="n">temperature</span><span class="o">=</span><span class="mf">0.0</span><span class="p">,</span>
+</span><span id="__span-0-7"><a id="__codelineno-0-7" name="__codelineno-0-7" href="#__codelineno-0-7"></a>    <span class="n">timeout</span><span class="o">=</span><span class="mi">120</span><span class="p">,</span>
+</span><span id="__span-0-8"><a id="__codelineno-0-8" name="__codelineno-0-8" href="#__codelineno-0-8"></a><span class="p">)</span>
+</span><span id="__span-0-9"><a id="__codelineno-0-9" name="__codelineno-0-9" href="#__codelineno-0-9"></a>
+</span><span id="__span-0-10"><a id="__codelineno-0-10" name="__codelineno-0-10" href="#__codelineno-0-10"></a><span class="n">url</span> <span class="o">=</span> <span class="s2">&quot;https://github.com/raznem/parsera&quot;</span>
+</span><span id="__span-0-11"><a id="__codelineno-0-11" name="__codelineno-0-11" href="#__codelineno-0-11"></a><span class="n">elements</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-12"><a id="__codelineno-0-12" name="__codelineno-0-12" href="#__codelineno-0-12"></a>    <span class="s2">&quot;Stars&quot;</span><span class="p">:</span> <span class="s2">&quot;Number of stars&quot;</span><span class="p">,</span>
+</span><span id="__span-0-13"><a id="__codelineno-0-13" name="__codelineno-0-13" href="#__codelineno-0-13"></a>    <span class="s2">&quot;Fork&quot;</span><span class="p">:</span> <span class="s2">&quot;Number of forks&quot;</span><span class="p">,</span>
+</span><span id="__span-0-14"><a id="__codelineno-0-14" name="__codelineno-0-14" href="#__codelineno-0-14"></a><span class="p">}</span>
+</span><span id="__span-0-15"><a id="__codelineno-0-15" name="__codelineno-0-15" href="#__codelineno-0-15"></a><span class="n">scrapper</span> <span class="o">=</span> <span class="n">Parsera</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="n">llm</span><span class="p">)</span>
+</span><span id="__span-0-16"><a id="__codelineno-0-16" name="__codelineno-0-16" href="#__codelineno-0-16"></a><span class="n">result</span> <span class="o">=</span> <span class="n">scrapper</span><span class="o">.</span><span class="n">run</span><span class="p">(</span><span class="n">url</span><span class="o">=</span><span class="n">url</span><span class="p">,</span> <span class="n">elements</span><span class="o">=</span><span class="n">elements</span><span class="p">)</span>
 </span></code></pre></div></p>
 <h2 id="run-local-model-with-ollama">Run local model with <code>Ollama</code></h2>
 <p>First, you should install and run <code>ollama</code> in your local environment: <a href="https://github.com/ollama/ollama?tab=readme-ov-file#ollama">official installation guide</a>.
 
@@ -2,62 +2,62 @@
 <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
     <url>
          <loc>https://docs.parsera.org/</loc>
-         <lastmod>2025-01-22</lastmod>
+         <lastmod>2025-01-27</lastmod>
     </url>
     <url>
          <loc>https://docs.parsera.org/contributing/</loc>
-         <lastmod>2025-01-22</lastmod>
+         <lastmod>2025-01-27</lastmod>
     </url>
     <url>
          <loc>https://docs.parsera.org/getting-started/</loc>
-         <lastmod>2025-01-22</lastmod>
+         <lastmod>2025-01-27</lastmod>
     </url>
     <url>
          <loc>https://docs.parsera.org/api/cookies/</loc>
-         <lastmod>2025-01-22</lastmod>
+         <lastmod>2025-01-27</lastmod>
     </url>
     <url>
          <loc>https://docs.parsera.org/api/getting-started/</loc>
-         <lastmod>2025-01-22</lastmod>
+         <lastmod>2025-01-27</lastmod>
     </url>
     <url>
          <loc>https://docs.parsera.org/api/precision-mode/</loc>
-         <lastmod>2025-01-22</lastmod>
+         <lastmod>2025-01-27</lastmod>
     </url>
     <url>
          <loc>https://docs.parsera.org/api/proxy/</loc>
-         <lastmod>2025-01-22</lastmod>
+         <lastmod>2025-01-27</lastmod>
     </url>
     <url>
          <loc>https://docs.parsera.org/features/custom-browser/</loc>
-         <lastmod>2025-01-22</lastmod>
+         <lastmod>2025-01-27</lastmod>
     </url>
     <url>
          <loc>https://docs.parsera.org/features/custom-cookies/</loc>
-         <lastmod>2025-01-22</lastmod>
+         <lastmod>2025-01-27</lastmod>
     </url>
     <url>
          <loc>https://docs.parsera.org/features/custom-models/</loc>
-         <lastmod>2025-01-22</lastmod>
+         <lastmod>2025-01-27</lastmod>
     </url>
     <url>
          <loc>https://docs.parsera.org/features/custom-playwright/</loc>
-         <lastmod>2025-01-22</lastmod>
+         <lastmod>2025-01-27</lastmod>
     </url>
     <url>
          <loc>https://docs.parsera.org/features/docker/</loc>
-         <lastmod>2025-01-22</lastmod>
+         <lastmod>2025-01-27</lastmod>
     </url>
     <url>
          <loc>https://docs.parsera.org/features/extractors/</loc>
-         <lastmod>2025-01-22</lastmod>
+         <lastmod>2025-01-27</lastmod>
     </url>
     <url>
          <loc>https://docs.parsera.org/features/proxy/</loc>
-         <lastmod>2025-01-22</lastmod>
+         <lastmod>2025-01-27</lastmod>
     </url>
     <url>
          <loc>https://docs.parsera.org/features/scrolling/</loc>
-         <lastmod>2025-01-22</lastmod>
+         <lastmod>2025-01-27</lastmod>
     </url>
 </urlset>