Quels types de services informatiques propose Novane ?

Novane est un cabinet spécialisé dans le développement de plateformes Web, de logiciels métiers et de solutions IA. On couvre l'intégralité du cycle de vie d'un projet digital : du maquettage à la prise en main par vos utilisateurs, en passant par le développement, le déploiement et l'acquisition. On propose aussi des services de conseil en stratégie digitale (première séance offerte), en transformation, en SEO et en cybersécurité.

Proposez-vous une garantie satisfait ou remboursé ?

Oui. Vous bénéficiez d'une garantie 7 jours satisfait ou remboursé à compter du début de la prestation. Cela couvre 100 % des honoraires Novane facturés durant la première semaine, hors frais tiers (nom de domaine, licences, hébergement). Un simple email suffit pour l'activer. Remboursement sous 14 jours ouvrés.

Quel est le délai moyen de réalisation d'un projet ?

Le délai dépend de la complexité. À titre indicatif : un site vitrine peut être livré en 1 à 3 semaines, une plateforme web ou un logiciel métier se réalise à partir de 3 semaines, une solution IA peut être fonctionnelle dès 2 semaines. Chaque étape est planifiée dès l'appel découverte pour vous donner une visibilité totale.

Quels sont vos tarifs et modèles de facturation ?

Nous proposons des formules forfaitaires et des missions en régie. Tous les tarifs sont transparents et validés par devis avant démarrage. Le paiement se fait à la semaine, au fur et à mesure de l'avancement du projet, ce qui permet de maîtriser le budget. Si vous avez un budget précis, nous adaptons la roadmap pour rester dans vos objectifs financiers.

Comment se passe le suivi et la maintenance après livraison ?

Le support technique est inclus gratuitement pendant 2 mois après la mise en ligne : corrections de bugs, ajustements mineurs et accompagnement sur la prise en main. Passé ce délai, nous proposons des formules de maintenance sur devis. Nous répondons sous 24h ouvrées à toutes vos questions même après la livraison.

Comment Novane fonctionne au quotidien sur un projet ?

Chez Novane, 1 sprint = 1 semaine. Chaque semaine, on définit ensemble les fonctionnalités à développer. Vous suivez l'avancement via un environnement de test déployé sur nos serveurs et un outil de suivi Jira. Un point hebdomadaire est organisé entre vous, le développeur et le manager du projet. La communication se fait via un canal Discord ou Slack dédié. Le paiement se fait à la semaine et la première semaine est satisfait ou remboursé.

Comment les solutions IA de Novane s'intègrent à mon écosystème existant ?

Nous nous adaptons à votre écosystème existant sans nécessiter de modifications majeures. Notre approche vise une intégration fluide des solutions IA, garantissant une transition en douceur et une efficacité accrue sans perturber vos opérations courantes. Nos assistants IA peuvent se connecter à vos outils existants : CRM, email, Slack, ERP, bases de données, Drive.

En quoi un assistant IA Novane est mieux que ChatGPT avec des documents uploadés ?

ChatGPT est un outil généraliste qui ne connaît pas votre entreprise. À chaque conversation, vous devez ré-uploader et recontextualiser vos documents. L'assistant IA Novane est une mémoire d'entreprise permanente, connectée nativement à vos outils (CRM, tickets, emails, Slack), avec vos règles et process intégrés. Il peut aussi automatiser des tâches comme envoyer des mails, trier des leads ou générer des comptes-rendus. Option déploiement local pour la confidentialité.

Gemma 4 QAT (5 juin 2026) : pourquoi la possibilité d’exécuter des modèles Gemma localement change les décisions produit et budget des PME et startups SaaS

10/06/2026

Image de Gemma 4 QAT (5 juin 2026) : pourquoi la possibilité d’exécuter des modèles Gemma localement change les décisions produit et budget des PME et startups SaaS

Intro — ce qui s’est passé

Le 5 juin 2026, Google / DeepMind a publié des checkpoints « Quantization‑Aware Training » (QAT) pour la famille Gemma 4 et présenté un modèle intermédiaire (Gemma 4 12B) pensé pour tourner sur PC portables et appareils grand public. Selon Google, ces checkpoints réduisent fortement l’empreinte mémoire et permettent d’exécuter des variantes de Gemma 4 en local (laptop / mobile) tout en conservant une qualité proche des modèles non quantifiés. Cette nouveauté rend possible des assistants et agents « offline » ou hybrides, avec des implications directes sur coût, confidentialité et architecture produit pour les dirigeants de startups et PME SaaS/ERP. (source Google) ([blog.google](https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4-builders/))

En clair : pourquoi c’est important pour vous

Jusque‑là, obtenir des performances de pointe demandait soit d’utiliser des APIs cloud payantes, soit d’investir lourdement dans des GPU serveurs. Avec Gemma 4 QAT, Google ouvre la possibilité de déployer des modèles puissants directement sur des postes clients (ou sur des machines edge) — ce qui change le calcul business‑technique sur :

coût récurrent d’API vs coût d’investissement matériel ;
propriété et confidentialité des données (moins d’exfiltration vers un cloud tiers) ;
latence et disponibilité (fonctionne sans connexion) ;
contrainte sur l’architecture (agents hybrides, on‑device inference + cloud fallback).

Données vérifiables (faits clés)

Google a annoncé la disponibilité des checkpoints QAT pour la famille Gemma 4 et la sortie récente du modèle Gemma 4 12B (début juin 2026). La page DeepMind/Gemma et le blog Google détaillent le déploiement QAT et les cas d’usage on‑device. (source DeepMind) ([deepmind.google](https://deepmind.google/models/gemma/?utm_source=openai))

Plusieurs médias techniques ont confirmé que les formats QAT sont distribués pour un usage local via outils populaires (gguf / llama.cpp / Ollama / LM Studio) et montrent que certaines variantes peuvent tourner avec moins d’1 Go de RAM dans les configurations mobiles allégées. (ex. Android Authority) ([androidauthority.com](https://www.androidauthority.com/gemma-4-qat-models-3675172/?utm_source=openai))

Analyse — impacts concrets par pilier Novane

1. Web / SaaS

Pour un SaaS, Gemma 4 QAT ouvre deux voies stratégiques : (1) internaliser l’inférence en l’exécutant sur des edge‑servers ou sur le poste client pour réduire la facture API, ou (2) proposer une expérience hybride (local + cloud) : le modèle local gère les tâches sensibles/offline, le cloud prend les charges élevées et la supervision.

Décision opérationnelle : évaluez maintenant les coûts totaux (TCO) plutôt que le seul prix au token. Un pilote local sur 10‑20 machines peut suffire à valider ROI latence / confidentialité avant une migration à grande échelle. (Voir stratégie produit et externalisation dans notre page services SaaS.)

2. Logiciels métiers / ERP‑CRM

Les outils métier sur terminaux terrain (techniciens, commerciaux, logistique) bénéficient immédiatement : assistants vocaux privés, synthèse de fiches clients hors ligne, aide à la saisie locale pour réseaux peu connectés. Cela réduit risques réglementaires liés au transfert de données sensibles vers des tiers.

Décision produit : prioriser cas d’usage offline pour pilotes terrain (gain fonctionnel visible, argument commercial fort pour clients B2B). Nos services ERP/CRM peuvent accompagner le design de ces pilotes. Nous pouvons vous aider.

3. IA / agents

Agentic workflows (agents effectuant actions autonomes) deviennent plus sûrs si le raisonnement critique est effectué localement. Mais attention : exécuter un modèle on‑device ne supprime pas le besoin de MLOps (monitoring, audits, mises à jour).

Décision sécurité & conformité : planifiez un pipeline de mise à jour signé, une gestion de versions et des tests d’acceptation (verifier fallback cloud si détection d’anomalie). Voir aussi nos offres intégration IA.

Risques et points à vérifier avant de choisir

Qualité réelle vs quantification : QAT limite les pertes mais certains usages (ex. scoring financier) exigent une évaluation rigoureuse avant production.
Maintenance et patching : modèles locaux + outils (Ollama, llama.cpp) exigent mise à jour et patching réguliers.
Licences et responsabilité : Gemma 4 est publié sous licence permissive (Apache 2.0 pour la famille), mais vérifiez obligations d’intégration, distributions de poids ou de binaires tiers. ([deepmind.google](https://deepmind.google/models/gemma/?utm_source=openai))
Support et SLA : exécution en local déplace la responsabilité d’infrastructure chez vous — prévoir budget support/infra.

Conseils opérationnels immédiats (roadmap 90 jours)

Faire un petit pilote (2–4 semaines) sur 1 cas d’usage prioritaire : assistant terrain, synthèse CRM, ou feature offline dans votre application. Mesures : latence, coût, qualité, incident rate.
Comparer TCO : coût d’hébergement API (estimation 12 mois) vs coût d’achat/maintenance de 10–50 endpoints GPU/edge + électricité + support.
Test de conformité : exiger log d’audit local, chiffrement au repos, et procédure de roll‑back. Intégrer ces critères dans vos contrats clients.
Choisir un stack technique minimal pour commencer : Ollama / LM Studio / llama.cpp + orchestration Docker simple. (Si besoin, notre équipe peut déployer un prototype.)
Plan de gouvernance modèle : versioning, tests d’impact, procédure d’alerte si dégradation de la qualité.

Exemple de KPI à suivre pour le pilote

Réduction du coût par requête ou par utilisateur actif (%)
Amélioration latence moyenne (ms)
Nombre d’incidents liés au modèle (erroneous outputs) / semaine
Taux d’adoption utilisateur du mode offline (%)

Conclusion — que décider aujourd’hui

Si vous gérez un produit SaaS, un ERP ou des outils terrain, lancez un pilote Gemma 4 QAT dès ce trimestre : la fenêtre pour capter avantage compétitif (coût + privacy + latence) est ouverte. Ne transformez pas tout d’un coup : préférez des parcours hybrides et validez les métriques clés avant migration. Pour la plupart des PME, la bonne décision est d’investir une petite somme (prototype) pour comprendre les gains réels et les coûts récurrents de maintenance.

Sources et lectures complémentaires

Gemma 4 QAT models — blog Google (5 juin 2026). ([blog.google](https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4-builders/))
Gemma — page officielle DeepMind / Gemma. ([deepmind.google](https://deepmind.google/models/gemma/?utm_source=openai))
Analyse technique — Android Authority (couverture médiatique). ([androidauthority.com](https://www.androidauthority.com/gemma-4-qat-models-3675172/?utm_source=openai))

Mini FAQ (questions que vos prospects googleront)

Gemma 4 QAT est‑il gratuit pour une PME ?
La licence du modèle est permissive (Apache 2.0 pour la famille Gemma 4) mais l’intégration, l’hébergement et le support ont un coût. Vérifiez aussi les restrictions des outils tiers (Ollama, LM Studio). ([deepmind.google](https://deepmind.google/models/gemma/?utm_source=openai))
Quelle différence entre QAT et PTQ ?
QAT intègre la quantification lors du training pour limiter la perte de qualité ; PTQ quantifie après‑coup et peut dégrader davantage la précision. (Conséquence : QAT est plus fiable sur tâches critiques.) ([blog.google](https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4-builders/))
Puis‑je remplacer mes appels API cloud par des modèles locaux dès maintenant ?
Pas sans test. Pour certaines tâches simples, oui ; pour workflows multi‑outils ou très gourmands, un mode hybride reste recommandé. Faites un pilote.
Quels outils pour démarrer un déploiement local ?
Ollama, llama.cpp, LM Studio, vLLM et runtimes comme LiteRT sont les choix courants aujourd’hui. Confirmez la compatibilité QAT des versions d’outils. ([lushbinary.com](https://lushbinary.com/blog/gemma-4-qat-self-hosting-guide-ollama-llama-cpp-vllm/?utm_source=openai))

Envie d’un diagnostic rapide ? Si vous voulez un audit technique et financier (3 semaines) pour estimer si Gemma 4 QAT est pertinent pour votre produit, demandez un devis ou contactez notre équipe : obtenir un devis • contact. (Novane propose des prototypes SaaS et intégrations IA sécurisées.)

1. En clair : pourquoi c’est important pour vous

1.1. Données vérifiables (faits clés)

2. Analyse — impacts concrets par pilier Novane

2.1. Web / SaaS

2.2. Logiciels métiers / ERP‑CRM

2.3. IA / agents

3. Risques et points à vérifier avant de choisir

4. Conseils opérationnels immédiats (roadmap 90 jours)

4.1. Exemple de KPI à suivre pour le pilote

5. Conclusion — que décider aujourd’hui

5.1. Sources et lectures complémentaires