ci: remove gated model from tests

philipithomas · philipithomas · commit 72d42d4cd638 · 2025-02-28T14:34:09.000-08:00
diff --git a/tests/generate_tests.py b/tests/generate_tests.py
@@ -198,9 +198,10 @@
         'basic',
     ],
 
-    'mistralai/Mistral-7B-Instruct-v0.1': [
-        'basic',
-    ],
+    # Remove gated model that requires authentication
+    # 'mistralai/Mistral-7B-Instruct-v0.1': [
+    #     'basic',
+    # ],
 
     'HuggingFaceH4/zephyr-7b-beta': [
         'system',
@@ -327,29 +328,32 @@ def generate_tokenizer_tests():
 
     for tokenizer_id in TOKENIZERS_WITH_CHAT_TEMPLATES:
         print(f'Generating chat templates for {tokenizer_id}')
-        tokenizer = AutoTokenizer.from_pretrained(
-            tokenizer_id,
-
-            # TODO: Remove once https://github.com/huggingface/transformers/pull/26678 is fixed
-            use_fast='llama' not in tokenizer_id,
-        )
-        tokenizer_results = []
-        for key in TOKENIZERS_WITH_CHAT_TEMPLATES[tokenizer_id]:
-            messages = CHAT_MESSAGES_EXAMPLES[key]
+        try:
+            tokenizer = AutoTokenizer.from_pretrained(
+                tokenizer_id,
+                # TODO: Remove once https://github.com/huggingface/transformers/pull/26678 is fixed
+                use_fast='llama' not in tokenizer_id,
+            )
+            tokenizer_results = []
+            for key in TOKENIZERS_WITH_CHAT_TEMPLATES[tokenizer_id]:
+                messages = CHAT_MESSAGES_EXAMPLES[key]
 
-            for add_generation_prompt, tokenize in product([True, False], [True, False]):
-                tokenizer_results.append(dict(
-                    messages=messages,
-                    add_generation_prompt=add_generation_prompt,
-                    tokenize=tokenize,
-                    target=tokenizer.apply_chat_template(
-                        messages,
+                for add_generation_prompt, tokenize in product([True, False], [True, False]):
+                    tokenizer_results.append(dict(
+                        messages=messages,
                         add_generation_prompt=add_generation_prompt,
                         tokenize=tokenize,
-                    ),
-                ))
-
-        template_results[tokenizer_id] = tokenizer_results
+                        target=tokenizer.apply_chat_template(
+                            messages,
+                            add_generation_prompt=add_generation_prompt,
+                            tokenize=tokenize,
+                        ),
+                    ))
+
+            template_results[tokenizer_id] = tokenizer_results
+        except (OSError, EnvironmentError) as e:
+            print(f"  - Skipping {tokenizer_id}: {str(e)}")
+            continue
 
     return dict(
         tokenization=tokenization_results,